夷陵剑客

邮件类型的文件解析

需求：这是2017年大概12月份去省厅出差时遇到的，当时有一大批邮件类型的文件，有人想把它的内容解析出来然后存到数据库里面进行查询。当时的难点就是把邮件内容分离出来存到数据库
解决：这个不算难，只是编码问题稍微麻烦点，重点是客户的数据不能带回家看

# -*- encoding: utf-8 -*-
import email
import re
import os
import multiprocessing
import time

import pymysql


"""
    FoxMail文件处理
"""


class FoxMailPrase(object):
    def __init__(self, fp):
        self.fp = fp

    def prase(self):
        # 数据打包
        d = dict()
        # 读取eml文件
        # fp = open(import_path, "r", encoding='utf-8')
        # 转换成email对象
        # fp = open(ph, "r")
        msg = email.message_from_file(self.fp)

        '''
        主题
        '''
        try:
            # 邮件主题的处理
            # [('"[email protected]" <[email protected]>', None)]
            subject1 = msg.get("Subject")
            # [(b'\xb5\xe7\xb7\xe7\xc9\xc8\xb7\xa2\xc9\xe4\xb5\xe3\xb7\xb8\xb5\xc3\xc9\xcf\xb7\xa2\xc9\xfa', 'gb2312')]
            subject_tuple = email.header.decode_header(subject1)
            # 编码处理
            code = subject_tuple[0][1]
            subject_content = subject_tuple[0][0]
            if subject1 is not None:
                if code:
                    subject_decode = subject_content.decode(code)
                else:
                    if isinstance(subject_content, str):
                        subject_decode = subject_content
                    else:
                        subject_decode = bytes.decode(subject_content)
            else:
                 subject_decode = ""
        except Exception as e:
            subject_decode = str(subject1)
        d['subject'] = subject_decode

        '''
        发件人
        '''

        try:
            # =?gbk?B?18rUtLmyz+2wyQ==?= 
            send = msg.get("From")
            if send is not None:
                # [(b'\xd7\xca\xd4\xb4\xb9\xb2\xcf\xed\xb0\xc9', 'gbk'), (b' ', None)]
                send_tuple = email.header.decode_header(send)
                # print(send_tuple)
                sends = []
                for e in send_tuple:
                    if e[1]:
                        sends.append(e[0].decode(e[1]))
                    else:
                        if isinstance(e[0], str):
                            sends.append(e[0])
                        else:
                            # bytes转str
                            sends.append(bytes.decode(e[0]))

                    from_user = ""
                    for s in sends:
                        from_user += s + ", "
            else:
                from_user = ""
        except Exception as e:
            from_user = send
        d['from'] = from_user

        '''
        抄送人
        '''

        try:
            cc = msg.get("Cc")
            if cc is not None:
                receive_tuple = email.header.decode_header(cc)
                ccs = []
                for e in receive_tuple:
                    if e[1]:
                        ccs.append(e[0].decode(e[1]))
                    else:
                        if isinstance(e[0], str):
                            ccs.append(e[0])
                        else:
                            # bytes转str
                            ccs.append(bytes.decode(e[0]))
                    cc_user = ",".join(ccs)
            else:
                cc_user = ""
        except Exception as e:
            cc_user = cc
        d['cc'] = cc_user

        '''
        收件人
        '''

        try:
            receive = msg.get("To")
            if receive is not None:
                receive_tuple = email.header.decode_header(receive)
                receives = []
                for e in receive_tuple:
                    if e[1]:
                        receives.append(e[0].decode(e[1]))
                    else:
                        if isinstance(e[0], str):
                            receives.append(e[0])
                        else:
                            # bytes转str
                            receives.append(bytes.decode(e[0]))
                to_user = ", ".join(receives)
            else:
                to_user = ""
        except Exception as e:
            to_user = receive
        d['to'] = to_user

        '''
        时间
        '''

        add_d = msg.get("Date")
        if add_d is None:
            add_date = ""
        else:
            add_date = add_d
        d['add_time'] = add_date

        '''
        IP处理
        '''
        # 找出相关ip
        # （1）把Message对象转换成str

        def ip_prase(header):
            msg_str = str(msg)
            # 按 换行符 分组
            lines = re.split("\n", msg_str)
            ips = []
            for line in lines:
                # 如果是Received
                if re.match(r"^"+header, line):
                    # 匹配ip
                    ip = re.findall(r"\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b", line)
                    if ip:
                        ips.append(ip[0])
            if len(ips) == 0:
                new_ip = ""
            else:
                # 去除重复，保留顺序
                ips2 = sorted(set(ips), key=ips.index)
                # 把list数据类型处理成字符串
                new_ip = ", ".join(ips2)
            return new_ip

        received_ip = ip_prase("Received:")
        originating_ip = ip_prase("X-Originating-IP:")
        d['received_ip'] = received_ip
        d['originating_ip'] = originating_ip

        '''
        邮件内容 mime
        '''
        """
        walk()函数能历遍邮件所有部分，所以通常都把它放到for循环里面使用。
        然后再使用is_multipart()函数来判断内容是否有用，打印出有用内容
        最后用get_payload(decode=True).decode('utf-8')解码并且打印到控制台。
        通常这个循环有两次，第一次是单纯的字符串格式的，能在控制台显示出来的，
        第二次循环打印的是像HTML的格式，能在浏览器里查看，就像平时看到的邮件那样
        """

        file_names = []
        contents = []
        try:
            for part in msg.walk():
                char_set = part.get_param("charset")
                # 获取附件名字
                name = part.get_param("name")
                # 如果ture的话内容是没用的
                if not part.is_multipart():
                    # 如果是附件
                    if name:
                        # [('4D20.tmp.png', None)]
                        # [(b'9Z2[R30(YJ5`$J04W6~1A(K.png', 'gb18030')]
                        file_tuple = email.header.decode_header(name)
                        file_names.append(file_tuple)
                    # 如果不是附件
                    else:
                        # 把编码加到集合
                        contents.append(char_set)
                        content = part.get_payload(decode=True)
                        contents.append(content)
        except Exception as e:
            file_names = []
            contents = []

        # 附件名称解码
        if len(file_names) == 0:
            files = ""
        else:
            filename_list = []
            for e in file_names:
                f = e[0][0]
                # print(isinstance(f, bytes))
                if isinstance(f, str):
                    # print(f)
                    filename_list.append(f)
                else:
                    try:
                        m = f.decode(str(e[0][1]))
                    except Exception as e:
                        m = str(f)
                    filename_list.append(m)
            # 附件名称变成可存储的字符串
            files = ", ".join(filename_list)

        d['files'] = files

        # 邮件内容解码
        content_decode = ""
        if len(contents) != 0:
            if contents[1]:
                c = contents[0]
                if c == None:
                    content_decode = str(contents[1])
                else:
                    try:
                        content_decode = str(contents[1].decode(c))
                    except Exception as e:
                        try:
                            if c[:2].lower() == "gb":
                                content_decode = str(contents[1].decode("gbk"))
                            elif c[:3].lower() == "utf":
                                content_decode = str(contents[1].decode("UTF-8"))
                            else:
                                content_decode = str(contents[1])
                        except Exception as e:
                            content_decode = str(contents[1])
            else:
                content_decode = ""
        
        ft = HtmlDeal()
        d['content'] = ft.filter_tags(content_decode)

        # print("主题:", subject_decode)
        # print("发件人:", from_user)
        # print("抄送人：", cc_user)
        # print("收件人:", to_user)
        # print("时间：", add_date)
        # print("发送IP:", originating_ip)
        # print("接收IP:", received_ip)
        # print("附件:", files)
        # print("内容：", ft.filter_tags(str(content_decode)))
        # print(d)

        return d


"""
文件目录遍历
"""


class FileList(object):
    def getListFiles(self, path):
        ret = []
        # 便利目录下出所有文件
        for root, dirs, files in os.walk(path):
            for filespath in files:
                ret.append(os.path.join(root, filespath))
        # 找出所有以 .eml 结尾的文件
        ret2 = []
        for each in ret:
            if each[-4:] == ".eml":
                ret2.append(each)
        return ret2


'''
数据存储处理
'''


class MysqlConn(object):
    def __init__(self, host, user, pwd, db):
        self.host = host
        self.user = user
        self.pwd = pwd
        self.db = db

    def execute(self, from_user, cc_user, to_user, subject, content, add_time, files, received_ip, originating_ip, url,):
        connection = pymysql.connect(host=self.host,
                                     user=self.user,
                                     password=self.pwd,
                                     db=self.db,
                                     charset='utf8',
                                     cursorclass=pymysql.cursors.DictCursor)

        try:
            with connection.cursor() as cursor:
                # Create a new record
                sql = "INSERT INTO email_list VALUES (0,"\
                      +"\""+ connection.escape_string(from_user) +"\"" + "," \
                      + "\"" + connection.escape_string(cc_user) + "\"" + "," \
                      + "\"" + connection.escape_string(to_user) + "\"" + ","\
                      +"\""+ connection.escape_string(subject) +"\""+","\
                      +"\"" + connection.escape_string(content) + "\""+","\
                      + "\"" + connection.escape_string(add_time) + "\"" + ","\
                      + "\"" + connection.escape_string(files) + "\"" + "," \
                      + "\"" + received_ip + "\"" + "," \
                      + "\"" + originating_ip + "\"" + "," \
                      + "\"" + connection.escape_string(url) + "\"" + ")" + ";"
                print(sql)
                cursor.execute(sql)

            # connection is not autocommit by default. So you must commit to save
            # your changes.
            connection.commit()
        finally:
            connection.close()

    def create_table(self):
        connection = pymysql.connect(host=self.host,
                                     user=self.user,
                                     password=self.pwd,
                                     db=self.db,
                                     charset='utf8',
                                     cursorclass=pymysql.cursors.DictCursor)
        try:
            with connection.cursor() as cursor:
                # Create a new record
                sql = "CREATE TABLE IF NOT EXISTS `email_list` (\
                          `id` int(11) NOT NULL AUTO_INCREMENT,\
                          `subject` varchar(100) DEFAULT NULL,\
                          `from` varchar(100) DEFAULT NULL,\
                          `cc` varchar(5000) DEFAULT NULL,\
                          `to` varchar(5000) DEFAULT NULL,\
                          `content` text,\
                          `sendtime` varchar(50) DEFAULT NULL,\
                          `files` varchar(255) DEFAULT NULL,\
                          `received_ip` varchar(255) DEFAULT NULL,\
                          `originating_ip` varchar(255) DEFAULT NULL,\
                          `url` varchar(255) DEFAULT NULL,\
                          PRIMARY KEY (`id`)\
                        ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;"

                # print(sql)
                cursor.execute(sql)

            # connection is not autocommit by default. So you must commit to save
            # your changes.
            connection.commit()
        finally:
            connection.close()


"""
处理html标签及空白行
"""


class HtmlDeal(object):
    # 过滤HTML中的标签
    # 将HTML中标签等信息去掉
    # @param htmlstr HTML字符串.
    def filter_tags(self, htmlstr):
        # 先过滤CDATA
        re_cdata = re.compile('//]*//\]\]>', re.I)  # 匹配CDATA
        re_script = re.compile('<\s*script[^>]*>[^<]*<\s*/\s*script\s*>', re.I)  # Script
        re_style = re.compile('<\s*style[^>]*>[^<]*<\s*/\s*style\s*>', re.I)  # style
        re_br = re.compile('')  # 处理换行
        re_h = re.compile(']*>')  # HTML标签
        re_comment = re.compile('')  # HTML注释
        s = re_cdata.sub('', htmlstr)  # 去掉CDATA
        s = re_script.sub('', s)  # 去掉SCRIPT
        s = re_style.sub('', s)  # 去掉style
        s = re_br.sub('\n', s)  # 将br转换为换行
        s = re_h.sub('', s)  # 去掉HTML 标签
        s = re_comment.sub('', s)  # 去掉HTML注释
        # 去掉多余的空行
        blank_line = re.compile('\n+')
        s = blank_line.sub('\n', s)
        s = self.replaceCharEntity(s)  # 替换实体
        sn = re.compile("\n\s*\n")
        s = sn.sub("\n", s)
        return s

    # 替换常用HTML字符实体.
    # 使用正常的字符替换HTML中特殊的字符实体.
    # 你可以添加新的实体字符到CHAR_ENTITIES中,处理更多HTML字符实体.
    # @param htmlstr HTML字符串.
    def replaceCharEntity(self, htmlstr):
        CHAR_ENTITIES = {'nbsp': ' ', '160': ' ',
                         'lt': '<', '60': '<',
                         'gt': '>', '62': '>',
                         'amp': '&', '38': '&',
                         'quot': '"', '34': '"', }

        re_charEntity = re.compile(r'&#?(?P\w+);')
        sz = re_charEntity.search(htmlstr)
        while sz:
            entity = sz.group()  # entity全称，如>
            key = sz.group('name')  # 去除&;后entity,如>为gt
            try:
                htmlstr = re_charEntity.sub(CHAR_ENTITIES[key], htmlstr, 1)
                sz = re_charEntity.search(htmlstr)
            except KeyError:
                # 以空串代替
                htmlstr = re_charEntity.sub('', htmlstr, 1)
                sz = re_charEntity.search(htmlstr)
        return htmlstr


"""
下面的方法处理主要是为了实现多进程，mian方法里面一般是不定义方法的，
即使语法正确也会出问题
"""


# 读取配置文件
def read_url():
    lines = []
    # 获取url.txt的路径
    new_path = os.path.join(os.getcwd(), "url.txt")
    with open(new_path, "r") as f:
        while 1:
            line = f.readline().replace("\n", "")
            lines.append(line)
            if not line:
                break
    return lines


# 创建数据表
def create_table():
    print("正在创建MySQL数据库表格......")
    time.sleep(2)
    r = read_url()
    db = MysqlConn(r[1], r[2], r[3], r[4])
    db.create_table()


# 插入数据
def insert_table(mail, path2):
    r = read_url()
    db = MysqlConn(r[1], r[2], r[3], r[4])
    db.execute(mail["subject"], mail["from"], mail["cc"], mail["to"], mail["content"],
               mail["add_time"], mail["files"], mail["received_ip"], mail['originating_ip'], path2)


# 文件完整路径集合
def file_list():
    # 调用方法创建数据表
    create_table()
    r = read_url()
    filelist = FileList()
    files = filelist.getListFiles(r[0])
    return files


# 解析邮件
def prase_mail(path1):
    try:
        fp1 = open(path1, "r")
        mailprase1 = FoxMailPrase(fp1)
        mail1 = mailprase1.prase()
        insert_table(mail1, path1)
    except Exception as e:
        try:
            fp2 = open(path1, "rb")
            mailprase2 = FoxMailPrase(fp2)
            mail2 = mailprase2.prase()
            insert_table(mail2, path1)
        except Exception as e:
            try:
                fp3 = open(path1, "r", encoding='utf-8', errors="ignore")
                mailprase3 = FoxMailPrase(fp3)
                mail3 = mailprase3.prase()
                if mail3["subject"] == "None" and mail3["to"] == "" and mail3["from"] == "":
                    # 处理有bom的utf-8文件
                    fp3 = open(path1, "r", encoding='utf-8-sig', errors="ignore")
                    mailprase3 = FoxMailPrase(fp3)
                    mail3 = mailprase3.prase()
                insert_table(mail3, path1)
            except Exception as e:
                with open(os.path.join(os.getcwd(), "error_log.txt"), "a") as f:
                    f.write(path1 + "\n")
                print(e)
    finally:
        print(path1)

if __name__ == '__main__':
    # 解决多进程程序pyinstaller打包后出现的问题（开启一大堆新进程）
    multiprocessing.freeze_support()
    # 多进程处理数据
    pool = multiprocessing.Pool(processes=multiprocessing.cpu_count())

    for path in file_list():
        pool.apply_async(prase_mail, (path, ))
        # prase_mail(path)
    pool.close()
    pool.join()

    print("总共有 %s 个文件！" % (len(file_list())))
"""
下面的是原始的单线程处理方法，单进程处理文件的实现方式
"""

"""
    # 读取配置文件
    def read_url():
        lines = []
        new_path = os.getcwd() + "\\url.txt"
        with open(new_path, "r") as f:
            while 1:
                line = f.readline().replace("\n", "")
                lines.append(line)
                if not line:
                    break
        return lines

    read_url = read_url()
    # print(read_url)

    filelist = FileList()
    files = filelist.getListFiles(read_url[0])

    db = MysqlConn(read_url[1], read_url[2], read_url[3], read_url[4])
    db.create_table()

    total = len(files)
    current_count = 1

    for path in files:
        try:
            fp1 = open(path, "r")
            mailprase1 = FoxMailPrase(fp1)
            mail = mailprase1.prase()
            # print(mailprase1)
            db.execute(mail["subject"], mail["from"], mail["to"], mail["content"],
                       mail["add_time"], mail["files"], mail["received_ip"], mail['originating_ip'], path)
            print("总共 %s 个文件，第 %s 个文件完成解析，路径是：%s" % (total, current_count, path))
            current_count += 1
        except Exception as e:
            try:
                fp2 = open(path, "r", encoding='utf-8')
                mailprase2 = FoxMailPrase(fp2)
                mail = mailprase2.prase()
                # print(mailprase2)
                db.execute(mail["subject"], mail["from"], mail["to"], mail["content"],
                           mail["add_time"], mail["files"], mail["received_ip"], mail['originating_ip'], path)
                print("总共 %s 个文件，第 %s 个文件完成解析，路径是：%s" % (total, current_count, path))
                current_count += 1
            except Exception as e:
                with open(os.getcwd() + "\\error_log.txt", "a") as f:
                    f.write(path + "\n")
                print("总共 %s 个文件，第 %s 个文件解析出现错误，路径是：%s" % (total, current_count, path))
                current_count += 1
                print(e)
"""

配置文件：url.txt
文件说明：（文件路径、IP、用户、密码、数据库名）
D:\share
127.0.0.1
xiang
123456
tree30

PyCharm 集成 DeepSeek：本地运行 or API 直连？打造你的 AI 编程神器！ AI云极【AI智能系列】pycharm 人工智能 ide deepseek
在AI赋能编程的时代，如何让AI辅助写代码，提升开发效率？DeepSeek作为一款开源、强大、免费的AI编程助手，结合PyCharm，能够大幅提升Python编程体验。今天，我们就来详细讲解如何在PyCharm中接入DeepSeek，无论你想使用本地部署的DeepSeek，还是官方API版本，都能轻松实现！为什么选择DeepSeek+PyCharm？DeepSeekR1采用6710亿参数的MoE（
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
【CUDA】Pytorch_Extensions joker D888 深度学习 pytorch python cuda c++深度学习
【CUDA】Pytorch_Extensions为什么要开发CUDA扩展？当我们在PyTorch中实现自定义算子时，通常有两种选择：使用纯Python实现（简单但效率低）使用C++/CUDA扩展（高效但需要编译）对于计算密集型的操作（如神经网络中的自定义激活函数），使用CUDA扩展可以获得接近硬件极限的性能。本文将以实现一个多项式激活函数x²+x+1为例，展示完整的开发流程。完整CUDA扩展代码解
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
本地搭建小型 DeepSeek 并进行微调非著名架构师大模型知识文档智能硬件人工智能大数据大模型 deepseek
本文将指导您在本地搭建一个小型的DeepSeek模型，并进行微调，以处理您的特定数据。1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选，用于GPU加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/deepseek-ai/deepseek.gitcddeepseek3.安装依赖bash复制pipinstall
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
python做一个注册界面_python如何做一个登录注册界面 weixin_39824033 python做一个注册界面
python做一个登录注册界面的方法：首先初始化一个window界面，并使用画布实现欢迎的logo；然后用代码实现登录和注册按钮；接着并进行登录判断代码；最后完成注册界面即可。【相关学习推荐：python视频教程】python做一个登录注册界面的方法：一、登录界面1、首先初始化一个window界面window=tk.Tk()window.title('WelcometoMofanPython')w
python读取zip包内文件_Python模块学习：zipfile zip文件操作 weixin_40001634 python读取zip包内文件
最近在写一个网络客户端下载程序，用于下载服务器上的数据。有些数据(如文本，office文档)如果直接传输的话，将会增加通信的数据量，使下载时间变长。服务器在传输这些数据之前先对其进行压缩，客户端接收到数据之后进行解压，这样可以减小网通传输数据的通信量，缩短下载的时间，从而增加客户体验。以前用C#做类似应用程序的时候，我会用SharpZipLib这个开源组件，现在用Python做类似的工作，只要使用
python制作登陆窗口_python登陆界面 weixin_39758494 python制作登陆窗口
广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！print(账号密码错误！请重试。)returnfalsebutton(master,text=登陆,width=10,command=test).grid(row=3,column=0,sticky=w,padx=10,pady=5)button(master,text=退出,wid
如何使用零配置的Sphinx生成Python文档？潮易 sphinx 全文检索搜索引擎
如何使用零配置的Sphinx生成Python文档？在Python编程中，编写文档是非常重要的。一个好的文档可以帮助其他开发者理解和使用你的代码。Sphinx是一个用于生成Python项目的文档的静态网页生成器，它支持多种文档格式，包括ReStructuredText和Markdown。以下是使用零配置的方式来使用Sphinx生成Python文档的详细步骤：1.首先，确保你已经安装了Sphinx。打
如何订阅&q；/扫描&q；主题、修改消息并发布到新主题？潮易 python 开发语言
如何订阅&q；/扫描&q；主题、修改消息并发布到新主题？这个问题涉及到Python编程中的MQTT（MessageQueuingTelemetryTransport）库的使用，该库允许我们创建客户端订阅和发布消息到MQTT服务器。以下是一个简单的步骤：1.安装MQTT库：可以使用pip安装`paho-mqtt`库。```pythonpipinstallpaho-mqtt```2.创建一个MQTT客
Python-tkinter自制登录界面（含注册） GCHEK python 开发语言
简单的用户登录、注册界面importtkinterastkimporttimeimportsubprocessimportsysimportosimporttkinter.messageboxwindow=tk.Tk()window.title('GCHEK')window.geometry('400x300')#设置储存用户信息的容器，这里用的txt。ifnotos.path.exists('U
Python爬虫requests(详细) dme. Python爬虫零基础入门爬虫 python
本文来学爬虫使用requests模块的常见操作。1.URL参数无论是在发送GET/POST请求时，网址URL都可能会携带参数，例如：http://www.5xclass.cn?age=19&name=dengres=requests.get(url="https://www.5xclass.cn?age=19&name=deng")res=requests.get(url="https://www
使用python计算等比数列求和的方法 HAMYHF windows
在python中，计算Sum=m+mm+mmm+mmmm+.....+mmmmm.....,输入两个数m,n。m的位数累加到n的值，列出算式并计算出结果：#为了打印出算式，并计算出结果，将m,mm这些放入到列表中#定义列表中的m初始值为0,用Ele来代表m,mm....Ele=0#定义总和为0Sum=0#定义一个空列表List=[]#输入两个值n=int(input("inputadigit：")
Python+Playwright常用元素定位方法 HAMYHF python 功能测试
CSSselector选择器在CSS中，定位元素主要通过选择器完成，以下是几种常见的CSS选择器定位方法：标签选择器(element):直接使用HTML元素名称来定位，例如p会选择所有段落元素。属性选择器(attribute):选择所有具有指定属性的元素，无论该属性的值是什么。例如，[title]会选择所有包含title属性的元素。选择具有指定属性，并且该属性值完全等于给定值的元素。例如，[typ
Python中的 redis keyspace 通知_python 操作redis psubscribe(‘__keyspace@0__ ‘) 2301_82243733 程序员 python 学习面试
最后Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习Python门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的Pytho
Python数据分析与可视化程序媛小果 python python 数据分析开发语言
Python数据分析与可视化在数据驱动的商业世界中，数据分析和可视化成为了理解复杂数据集、做出明智决策的关键工具。Python，作为一种功能强大且易于学习的编程语言，提供了丰富的库和框架，使得数据分析和可视化变得简单高效。本文将探讨Python在数据分析和可视化中的应用，包括数据预处理、分析、以及如何通过可视化工具将数据洞察转化为可操作的策略。1.数据分析的重要性数据分析是提取数据中有用信息的过程
【Python 学习 / 7】模块与文件操作卜及中 Python基础 python 学习数据库
文章目录前言一、导入模块1.导入整个模块2.导入模块中的特定函数3.给模块或函数起别名二、常用模块1.`math`模块2.`random`模块3.`os`模块4.`sys`模块三、文件处理1.打开文件2.读取文件3.写入文件4.关闭文件5.使用`with`语句管理文件四、日期时间1.`datetime`模块获取当前日期和时间创建日期和时间对象格式化日期和时间解析字符串为日期对象2.`time`模块
经销商管理系统架构设计方案（附 Java版本和Python版本源代码详解） AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
经销商管理系统架构设计方案（Java实现源代码详解）关键词：经销商管理系统，Java，SpringBoot，MyBatis，MySQL，架构设计，源代码1.背景介绍随着市场竞争的日益激烈，企业对经销商的管理越来越重视。传统的经销商管理方式效率低下，信息滞后，难以适应现代企业的发展需求。为了提高经销商管理效率，降低运营成本，越来越多的企业开始采用信息化的手段来管理经销商，而经销商管理系统应运而生。经
Python:数据从Excel表格链接到Word文档更新Excel即可自动更新Word 一个花生米生花 python excel word
要使用Python来创建或更新一个Word文档，并将数据从Excel表格链接到Word文档中，你可以使用python-docx库来操作Word文档和openpyxl或pandas库来读取Excel文件。不过，需要注意的是，python-docx库并不支持将外部文件链接到Word文档的功能。你可以在Word文档中插入Excel数据的快照，但它们不会自动更新。如果你想要在Word文档中插入Excel数
使用Odoo Shell卸载模块 odoo中国 odoo odoo 开源软件 erp
使用OdooShell卸载模块我们在Odoo使用过程中，因为模块安装错误或者前端错误等导致odoo无法通过界面登录，这时候你可以使用OdooShell来卸载模块。OdooShell是一个交互式Pythonshell，允许你直接与Odoo数据库和模型进行交互。以下是使用OdooShell卸载模块的详细步骤：步骤1：启动OdooShell要启动OdooShell，你需要在终端中运行以下命令。确保你已经
NumPy的基本使用 Mo思编程学习 numpy python 开发语言 pip
在Python的数据科学与数值计算领域，NumPy无疑是一颗耀眼的明星。作为Python中用于科学计算的基础库，NumPy提供了高效的多维数组对象以及处理这些数组的各种工具。本文将带您深入了解NumPy的基本使用，感受它的强大魅力。一、安装与导入在使用NumPy之前，首先要确保它已经安装在您的Python环境中。如果您使用的是Anaconda发行版，NumPy通常已经预装。若未安装，可以使用如下命
FOKS-TROT: 一个高效、易用的全功能开源知识图谱生成工具柳旖岭
FOKS-TROT:一个高效、易用的全功能开源知识图谱生成工具项目简介FOKS-TROT是一个基于Python的全功能开源知识图谱生成工具，旨在帮助研究人员和开发者快速构建具有丰富信息的知识图谱。该项目由hkx3upper在GitCode上开发并维护。通过FOKS-TROT，您可以轻松地将各种数据源（如文本文件、数据库、API）转换为结构化的知识图谱，并对其进行可视化分析和机器学习任务。此外，该工
python实现word文档合并 v2.0 task138 python自动化 python 自动化运维开发
目录前言要求运行效果脚本下载链接前言之前发表了一个小工具，python用于合并word文档以完成特定的工作任务，现在领导给出了新需求，适当的调整了一下word文档的合并情况。同时，各位同事反馈说，环境部署太难了，脚本的使用成本比较高，难度大，所以我这次把脚本打包成一个EXE可执行文件，直接双击即可使用。要求由于脚本的具体逻辑发生了变化，因此，exe文件的同级目录下，一定要存在一个txt文件，否则无
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 安全 web安全网络网络安全 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 网络安全 web安全 linux 密码学 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

邮件类型的文件解析

你可能感兴趣的:(Python)