• 一个基与邮件的数据下载存储系统


    一个基与邮件的数据下载存储系统,它包括数据生成和传递以及定时执行两部分。

    一、数据生成和传递

    1、获取特定时间段的数据
    2、将获取数据保存到feather/csv
    3、邮件发送
    4、本地邮件下载,不用登录客户端。下载后改邮件状态为已读。
    5、上传网盘

    import os
    import email
    import imaplib
    import smtplib
    from email.message import EmailMessage
    from pandasrw import load,dump
    import schedule
    import time
    
    ##函数########################
    
    # 发送带附件的邮件。参数为发送方用户名、发送方密码、接受方邮箱地址(可以为列表,元素为邮箱地址)、邮件主题、邮件正文,附件路径
    def send_attachment(username, password, email_receiver, subject, body, file_path,host, port):
        # 创建邮件对象
        em = EmailMessage()
        em['From'] = username
        em['To'] = email_receiver
        em['Subject'] = subject
        em.set_content(body)
    
        # 打开附件
        with open(file_path, 'rb') as f:
            file_data = f.read()
            file_name = f.name
        file_name = os.path.basename(file_name)
    
        # 将附件写入邮件
        em.add_attachment(file_data, maintype='application', subtype='octet-stream', filename=file_name)
    
        # 输入stmp的host和port并发送邮件
        with smtplib.SMTP_SSL(host, port) as smtp:
            smtp.login(username, password)
            smtp.send_message(em)
    
    #接收邮件,并下载附件。参数为用户名、密码、下载路径和接受协议配置
    def receive_attachment(username, password, download_path, imap_server):
        # 建立接受邮件对象
        imap = imaplib.IMAP4_SSL(imap_server)
        imap.login(username, password)
        # 选择收件箱
        imap.select('INBOX')
        # 接受所有未读邮件,参数'UNSEEN'控制
        status, data = imap.search(None, 'UNSEEN')
        unread_msg_nums = data[0].split()
    
        # 使用imap.fetch获取邮件内容,然后用email模块的message_from_bytes解析邮件,
        # 遍历邮件中的每个部分,看是否有filename字段,如果有就表示这是一个附件,然后获取附件内容并写入文件。
        for num in unread_msg_nums:
            # RFC822 代表接受邮件的全部内容,包括标题、正文和附件
            status, data = imap.fetch(num, '(RFC822)')
            msg = email.message_from_bytes(data[0][1])
    
            for part in msg.walk():
                if part.get_content_maintype() == 'multipart':
                    continue
                if part.get('Content-Disposition') is None:
                    continue
    
                filename = part.get_filename()
                if bool(filename):
                    print('Downloading attachment:', filename)
                    attach_data = part.get_payload(decode=True)
                    # 注意:文件用双反斜杠链接
                    file_path = download_path + '\\' + filename
                    with open(file_path, 'wb') as f:
                        f.write(part.get_payload(decode=True))  # 将附件解码并写入文件
    
        imap.close()
        imap.logout()
    
    #改变邮件状态为已读,参数为参数为用户名、密码、接受协议配置
    def change_flags(username,password,imap_server):
        imap = imaplib.IMAP4_SSL(imap_server)
        imap.login(username, password)
        imap.select('INBOX')
        status, data = imap.search(None, 'UNSEEN')
        unread_msg_nums = data[0].split()
    
        for num in unread_msg_nums:
            # 修改邮件的标志位为已读
            imap.store(num, '+FLAGS', '\\Seen')
    
        imap.close()
        imap.logout()
    
    #下载附件并将邮件标记未已读
    def receive_attachment_readed(username, password, download_path, imap_server):
        # 建立接受邮件对象
        imap = imaplib.IMAP4_SSL(imap_server)
        imap.login(username, password)
        # 选择收件箱
        imap.select('INBOX')
        # 接受所有未读邮件,参数'UNSEEN'控制
        status, data = imap.search(None, 'UNSEEN')
        unread_msg_nums = data[0].split()
    
        # 使用imap.fetch获取邮件内容,然后用email模块的message_from_bytes解析邮件,
        # 遍历邮件中的每个部分,看是否有filename字段,如果有就表示这是一个附件,然后获取附件内容并写入文件。
        for num in unread_msg_nums:
            # RFC822 代表接受邮件的全部内容,包括标题、正文和附件
            status, data = imap.fetch(num, '(RFC822)')
            msg = email.message_from_bytes(data[0][1])
    
            for part in msg.walk():
                if part.get_content_maintype() == 'multipart':
                    continue
                if part.get('Content-Disposition') is None:
                    continue
    
                filename = part.get_filename()
                if bool(filename):
                    print('Downloading attachment:', filename)
                    attach_data = part.get_payload(decode=True)
                    # 注意:文件用双反斜杠链接
                    file_path = download_path + '\\' + filename
                    with open(file_path, 'wb') as f:
                        f.write(part.get_payload(decode=True))  # 将附件解码并写入文件
                # 修改邮件的标志位为已读
                imap.store(num, '+FLAGS', '\\Seen')
    
        imap.close()
        imap.logout()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90
    • 91
    • 92
    • 93
    • 94
    • 95
    • 96
    • 97
    • 98
    • 99
    • 100
    • 101
    • 102
    • 103
    • 104
    • 105
    • 106
    • 107
    • 108
    • 109
    • 110
    • 111
    • 112
    • 113
    • 114
    • 115
    • 116
    • 117
    • 118
    • 119
    • 120
    • 121
    • 122

    二、定时执行

    通过schedule库来进行定时执行。

    def job():
        print("我正在执行任务!")
    
    # 设定每天早上8点执行任务
    schedule.every().day.at("08:00").do(job)
    
    while True:
        try:
    
             schedule.run_pending()  # 运行所有可以运行的任务
             time.sleep(1)
             
        except Exception as e:
             time.sleep(1)
             print(e)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    1、定点执行下载数据

     def job():
            host, port = "smtp.qq.com", 465
            imap_server = 'imap.qq.com'
            username = "xx"
            password = "xx"
            # 接受方信息,可以是列表[邮箱1,邮箱2]
            email_receiver = "xx"
            subject = "测试"
            body = '邮件正文'
            # 要下载的附件文件夹
            download_path = "D:\\data\\xx"
    
            #1、在服务器上获取数据,并形成带时间戳的文件
            path1=r"xx"
            df=load(path1)
            path2=r"xx"
            fp=dump(df,path2,time=True)
            file_path = fp.replace('\\', '\\')
            #2、在服务器上发送邮件
            send_attachment(username, password, email_receiver, subject, body,file_path,host, port)
            time.sleep(10)
            os.remove(file_path)
    
    
        schedule.every(10).seconds.do(job)
    
        while True:
            try:
    
                schedule.run_pending()  # 运行所有可以运行的任务
                time.sleep(1)
    
            except Exception as e:
                time.sleep(1)
                print(e)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35

    注意:在PyCharm中使用schedule库后,关闭PyCharm并不会停止程序的运行。这是因为schedule库是一个独立的任务调度工具,它会在后台继续运行预定的任务。

  • 相关阅读:
    如何提升和扩展 PostgreSQL — 从共享缓冲区到内存数据网格
    对比四大智能合约语言:Solidity 、Rust 、 Vyper 和 Move
    常用:css样式,特殊
    使用LoadRunner错误总结
    SpringBoot:MVC自动配置原理
    全球与中国无线演示器行业市场前瞻及未来发展趋向预测报告2022-2028年
    全链路压测的整体架构设计,以及5种实现方案流量染色方案、数据隔离方案、接口隔离方案、零侵入方案、服务监控方案【代码级别】
    Python 物联网之用于基于 TinyFlux的物联网和分析应用程序的微型时间序列数据库
    操作系统02_进程管理_同步互斥信号量_PV操作_死锁---软考高级系统架构师007
    2023 IDC中国数字金融论坛丨中电金信向行业分享“源启+应用重构”新范式
  • 原文地址:https://blog.csdn.net/A41915460/article/details/132679736