python读取excel，某列值是网址和邮箱一起存储的（通过|分割），如何分开提取_Python

2条回答

卡卡

2楼 · 2021-02-25 14:19

上代码

importimapclient

#这个包导不进来，先导入pyzmail36，下载好后再改回pyzmail即可

importpyzmail

frombs4importBeautifulSoup

importpandasaspd

importxlsxwriter

importhtml5lib

#提取邮件里面的表格

classmy_eamil():

"""

构造函数，创建一个类的入口

self指的是类实例对象本身

后面传入三个参数，即：邮箱地址、密码、邮件服务

"""

def__init__(self,user,password,eamil_server):

self.user=user

#此处密码是授权码,用于登录第三方邮件客户端

self.password=password

self.pop3_server=eamil_server

#获取邮件中的表格

defget_taleStr(self):

#腾讯企业邮箱

imapObj=imapclient.IMAPClient(eamil_server,ssl=True)

#邮箱和密码

imapObj.login(user,password)

#默认收件箱

imapObj.select_folder('INBOX',readonly=True)

#搜索未读邮件，打印未读邮件的UID

UIDS=imapObj.search('UNSEEN')

#print(UIDS)

#UIDS=imapObj.search('ALL')#搜索全部的邮件

iflen(UIDS)>=1:#存在未读邮件

#获得邮件内容

rawMessage=imapObj.fetch(UIDS[0],[b'BODY[]'])

#选择第一封未读邮件

messageObj=pyzmail.PyzMessage.factory(rawMessage[UIDS[0]][b'BODY[]'])

#打印邮件信息，可以根据这些信息进行筛选

print('邮件主题',messageObj.get_subject())

print('发件人',messageObj.get_addresses('from'))

print('收件人',messageObj.get_addresses('to'))

#邮件内容不为空时

ifmessageObj.html_part!=None:

messageContent=messageObj.html_part.get_payload().decode(messageObj.html_part.charset)

#设置邮件已读

#imapObj.set_flags(rawMessage,b'\\Seen',silent=False)

else:

pass

#退出邮件

imapObj.logout()

#如果邮件内容存在链接则返回链接，若不存在则直接下载邮件附件

returnmessageContent

#邮件中的表格写入excel中

deftable_Excel(self,tableHtml,file_name):

#是指定Beautiful的解析器为“html.parser”

soup=BeautifulSoup(tableHtml,'html.parser')

#寻找所有的表格

tables=soup.find_all('table')

#excel写入器

writer=pd.ExcelWriter(file_name,engine='xlsxwriter')

workbook=writer.book

#可遍历的数据对象

foridx,tableinenumerate(tables):

#定义sheet名称

sheet_name='Table-'+str(idx)

#获取table数据

df_table=pd.read_html(str(table),header=0,flavor='bs4')[0]

#table数据写入Excel

df_table.to_excel(writer,index=False,sheet_name=sheet_name)

#获取sheet对象

worksheet=writer.sheets[sheet_name]

#设置表头样式

header_fmt=workbook.add_format({'font_size':14,'bold':True,'fg_color':'#D7E4BC','border':1})

#写入表头

forcol_num,valueinenumerate(df_table.columns.values):

worksheet.write(0,col_num,value,header_fmt)

#调整列宽

worksheet.set_column('A:Z',25)

#保存文件

writer.save()

#开始执行

#邮箱地址

user=''

#密码，若是163邮箱则使用客户端密码

password=''

eamil_server='pop.exmail..com'

file_name="E:\\export.xlsx"

#调用类

myEmail=my_eamil(user=user,password=password,eamil_server=eamil_server)

tableHtml=myEmail.get_taleStr()

myEmail.table_Excel(tableHtml,file_name)

visonx

3楼 · 2021-03-19 11:53