很菜的小jiang

【Python小工具】Python小工具批量提取Excel图片

目前有一个需求，就是批量读取当前目录下所有文件夹里的Excel文件，去获取出Excel文件中的图片，并根据图片对应的行去获取某列的值作为命名方式进行命名，并统一保存在一个新的文件夹里面。

自己花了几个小时写了一个小工具出来，利用的是openpyxl这个库，其他库用了提取效果不太好，这个提取效果挺不错的。以下代码要根据实际需求，将“货品编码”改成你对应需要的值。如果你不需要命名规则，则直接去掉都行。

第一个版本，针对于不规则分布图片的Excel，进行每个单元格进行遍历，比较费时：

import os
from openpyxl import load_workbook
from openpyxl.drawing.image import Image
from openpyxl_image_loader import SheetImageLoader
from openpyxl.utils.cell import get_column_letter
from PIL import Image

# 创建文件夹
def create_folder():
    if not os.path.exists('images'):
        os.makedirs('images')
    print("成功创建/更新文件夹!")

# 获取当前目录下的文件夹
def get_folders(directory):
    folders = []
    for entry in os.scandir(directory):
        if entry.is_dir():
            folders.append(entry.name)
    print("成功获取当前目录的文件夹！")
    return folders

# 提取图片
def extract_images():
    # 创建存放文件夹
    create_folder()
    # 获取当前目录下的文件夹
    folders = get_folders('.')
    i = 1
    num = 1
    # 遍历当前目录下的文件夹
    for folder in folders:
        print(f"正在遍历第{i}个文件夹{folder}......")
        # 进行提取图片
        num = extract_images_from_excel(folder, num)
        i += 1

# 进行提取图片
def extract_images_from_excel(folder, num):
    # 遍历当前文件夹内的所有文件
    for entry in os.scandir('.\\'+folder):
        # 如果当前对象是文件且后缀是xlsx
        if entry.is_file() and entry.name.endswith('.xlsx'):
            print(f'{folder}下的Excel文件路径为：{entry.path}')
            # 打开当前文件
            wb = load_workbook(entry.path)
            # 获取当前xlsx的所有Sheet表
            worksheets = wb.worksheets
            # 遍历xlsx中每一个Sheet
            for ws in worksheets:
                # 获取当前列名为货品编码的列序号
                code_index = ''
                for column in ws.iter_cols():
                    if column[0].value == "货品编码":
                        code_index = column[0].column
                # 创建图片加载对象
                image_loader = SheetImageLoader(ws)
                # 每一行进行遍历，获取行序号和该行数据
                for row_index, row in enumerate(ws.rows, start=1):
                    # 每一列进行遍历
                    for column_index in range(1, len(row) + 1):
                        # 获取列序号
                        column_letter = get_column_letter(column_index)
                        # 如果当前单元格是图片
                        if image_loader.image_in(f'{column_letter}{row_index}'):
                            # 获取图片
                            image = image_loader.get(f'{column_letter}{row_index}')
                            # 获取图片格式
                            image_type = image.format
                            # 获取当前行的货品编码列的值
                            code = ws.cell(row=(row_index), column=code_index).internal_value
                            # 保存图片(保存命名为 序号_货品编码)
                            print(f'正在提取单元格{column_letter}{row_index + 1}的图片......')
                            image.save(f"./images/{code}_{num}.{image_type}")
                            # 序号递增
                            num += 1
            # 关闭文件对象
            wb.close()
    return num


if __name__ == '__main__':
    print("此版本是针对于图片分布不规则的情况，提取图片速度尚且较慢")
    print("开始提取......")
    # 提取图片
    extract_images()
    print("提取完成！")

第二个版本，针对于某一列统一分布图片的Excel，只会进行有图片那一列的遍历，比较快速：

import os
from openpyxl import load_workbook
from openpyxl.drawing.image import Image
from openpyxl_image_loader import SheetImageLoader
from openpyxl.utils.cell import get_column_letter
from PIL import Image

# 创建文件夹
def create_folder():
    if not os.path.exists('images'):
        os.makedirs('images')
    print("成功创建/更新文件夹!")

# 获取当前目录下的文件夹
def get_folders(directory):
    folders = []
    for entry in os.scandir(directory):
        if entry.is_dir():
            folders.append(entry.name)
    print("成功获取当前目录的文件夹！")
    return folders

# 提取图片
def extract_images():
    # 创建存放文件夹
    create_folder()
    # 获取当前目录下的文件夹
    folders = get_folders('.')
    i = 1
    num = 1
    # 遍历当前目录下的文件夹
    for folder in folders:
        print(f"正在遍历第{i}个文件夹{folder}......")
        # 进行提取图片
        num = extract_images_from_excel(folder, num)
        i += 1

# 进行提取图片
def extract_images_from_excel(folder, num):
    # 遍历当前文件夹内的所有文件
    for entry in os.scandir('.\\'+folder):
        # 如果当前对象是文件且后缀是xlsx或者xls
        if entry.is_file() and (entry.name.endswith('.xlsx') or entry.name.endswith('.xls')):
            print(f'{folder}下的Excel文件路径为：{entry.path}')
            # 打开当前文件
            wb = load_workbook(entry.path)
            # 获取当前xlsx的所有Sheet表
            worksheets = wb.worksheets
            # 遍历xlsx中每一个Sheet
            for ws in worksheets:
                # 获取当前列名为货品编码的列序号
                code_index = ''
                for column in ws.iter_cols():
                    if column[0].value == "货品编码":
                        code_index = column[0].column
                # 创建图片加载对象
                image_loader = SheetImageLoader(ws)
                # 记录第一次遍历的标志
                img_sign_index = ''
                # 每一行进行遍历，获取行序号和该行数据
                for row_index, row in enumerate(ws.rows, start=1):
                    # 只有第一次才会进行每列遍历，去找到图片所在的列
                    if img_sign_index == '':
                        # 每一列进行遍历
                        for column_index in range(1, len(row) + 1):
                            # 获取列序号
                            column_letter = get_column_letter(column_index)
                            if image_loader.image_in(f'{column_letter}{row_index}'):
                                # 获取对应图片的列序号
                                img_sign_index = column_letter
                                break
                    # 如果不为空，则证明有图片，反之直接跳过
                    if img_sign_index != '':
                        # 后面遍历直接去找图片所在的列
                        image = image_loader.get(f'{img_sign_index}{row_index}')
                        # 获取图片格式
                        image_type = image.format
                        # 获取当前行的货品编码列的值
                        code = ws.cell(row=(row_index), column=code_index).internal_value
                        # 保存图片(保存命名为 序号_货品编码)
                        print(f'正在提取单元格{img_sign_index}{row_index + 1}的图片......')
                        image.save(f"./images/{num}_{code}.{image_type}")
                        # 序号递增
                        num += 1

            # 关闭文件对象
            wb.close()
    return num


if __name__ == '__main__':
    print("此版本是针对于图片集中分布在一列的情况，能更快提取图片出来")
    print("开始提取......")
    # 提取图片
    extract_images()
    print("提取完成！")

注释都比较清楚，但是现在有一个问题就是，image_loader.get()方法只能提取包含于单元格内的图片，不能获取在单元格边缘有溢出的图片，目前还没有去解决这个问题，之后解决后会更新。

2023-07-03 更新

第三个版本

此版本不是遍历单元格，是直接找图片，再锁定图片的中心行位置去找相应的货品编码，效率更高，而且不会因为图片位于单元格边缘存在识别不到的问题。

import os

from openpyxl import load_workbook
import os
from openpyxl_image_loader import SheetImageLoader
from openpyxl.utils.cell import get_column_letter

# 创建文件夹
def create_folder():
    if not os.path.exists('images'):
        os.makedirs('images')
    print("成功创建/更新文件夹!")

# 获取当前目录下的文件夹
def get_folders(directory):
    folders = []
    for entry in os.scandir(directory):
        if entry.is_dir():
            folders.append(entry.name)
    print("成功获取当前目录的文件夹！")
    return folders

# 提取图片
def extract_images():
    # 创建存放文件夹
    create_folder()
    # 获取当前目录下的文件夹
    folders = get_folders('.')
    i = 1
    num = 1
    # 遍历当前目录下的文件夹
    for folder in folders:
        print(f"正在遍历第{i}个文件夹{folder}......")
        # 进行提取图片
        num = extract_images_from_excel(folder, num)
        i += 1

# 进行提取图片
def extract_images_from_excel(folder, num):
    # 遍历当前文件夹内的所有文件
    for entry in os.scandir('.\\'+folder):
        # 如果当前对象是文件且后缀是xlsx或者xls
        if entry.is_file() and entry.name.endswith('.xlsx'):
            print(f'{folder}下的Excel文件路径为：{entry.path}')
            # 打开当前文件
            wb = load_workbook(entry.path)
            # 遍历每一个Sheet
            for sheet_name in wb.sheetnames:
                sheet = wb[sheet_name]
                image_loader = SheetImageLoader(sheet)
                # 获取当前列名为货品编码的列序号
                code_index = ''
                for column in sheet.iter_cols():
                    if column[0].value == "货品编码":
                        code_index = column[0].column
                # 遍历Sheet中的所有图片
                for image in sheet._images:
                    # 获取图片中心行数，判断货品编码是哪一个
                    row_index = (int(((image.anchor._from.row + 1) + (image.anchor.to.row + 1)) / 2))
                    # 获取当前行的货品编码列的值(取中间值)
                    code = sheet.cell(row=row_index, column=code_index).value
                    # 获取图片格式
                    img_format = image.format
                    # 重新将图片获取出来(因为获取下标这个image没有存储方法)，直接通过定位左上角坐标将图片取出来
                    img = image_loader.get(f'{get_column_letter(image.anchor._from.col + 1)}{image.anchor._from.row + 1}')
                    # 保存图片
                    print(f'正在提取货品编码为{code}的图片{image}......')
                    img.save(f'./images/{num}_{code}.{img_format}')
                    # 序号递增
                    num += 1

            # 关闭文件对象
            wb.close()
    return num

# v1.0：此版本是针对于图片分布不规则的情况，提取图片速度尚且较慢
# v1.1：此版本是针对于图片集中分布在一列的情况，能更快提取图片出来。
# v1.2：此版本解决图片位于Excel边界时存在的问题，只要图片中心行在这一行，就可以匹配相应的国家编码，同时不用去遍历，直接获取图片。
if __name__ == '__main__':
    print("开始提取......")
    # 提取图片
    extract_images()
    print("提取完成！")

2023-10-08 更新

第四个版本：增加了图片的压缩，不需要压缩的可以直接不调用压缩犯法即可，增加了交互，听取了评论区大佬的意见，现在可以提取同一单元格多张图片，在此谢谢评论区大佬。

import math

from openpyxl import load_workbook
import os
from PIL import Image

# 命名规则
good_code = ""
# 命名字典
name_dict = {}
# 图片数量
img_num = 0
# 记录哪些文件夹已经被提取过了
folder_name_dict = {}
# 是否输出提取文本
is_text = True


# 创建文件夹
def create_folder():
    if not os.path.exists('images'):
        os.makedirs('images')
    print("成功创建/更新images文件夹!")


# 提取图片
def extract_images(stop):
    if stop:
        return
    global img_num
    global good_code
    folder = input("请输入需要提取的文件夹名称（不输入则遍历当前目录下未提取过的所有文件夹）：")
    good_code = input("请输入命名规则对应表格中的名字（不输入则默认为货品编码）：")
    if good_code == "":
        good_code = "货品编码"
    if folder != '':
        # 查找指定文件夹
        extract_images_from_excel(folder)
    else:
        folders = []
        for entry in os.scandir('.'):
            if entry.is_dir():
                folders.append(entry.name)
        i = 1
        # 记录可提取的文件夹的数量
        number = 0
        # 遍历当前目录下的文件夹
        for folder in folders:
            if folder in folder_name_dict:
                continue
            print(f"正在遍历第{i}个文件夹{folder}......")
            # 进行提取图片
            extract_images_from_excel(folder)
            number += 1
            i += 1
        if number == 0:
            print("没有可供提取的文件夹了！")
            return
    is_success()
    img_num = 0
    status = input("\n是否继续提取（输入Y表示是，输入其他则退出）：")
    if status == "Y" or status == "y":
        extract_images(False)
    else:
        extract_images(True)


def is_success():
    if img_num == 0:
        if is_text:
            print(f'没有提取到图片！')
    else:
        print(f'成功提取{img_num}张图片！')
        print("图片提取完成，请到images文件夹中查看！")


# 进行提取图片
def extract_images_from_excel(folder):
    global img_num
    global is_text
    is_have_excel = False
    path = os.path.join('.', folder)
    if not os.path.exists(path):
        print(f'{folder}文件夹未找到！')
        return
    # 判断文件夹是否已经被提取过了
    if folder not in folder_name_dict:
        is_text = True
    else:
        print(f'{folder}文件夹已经被提取过了！')
        is_text = False
        return
    try:
        # 遍历当前文件夹内的所有文件
        for entry in os.scandir(path):
            # 如果当前对象是文件且后缀是xlsx或者xls
            if entry.is_file() and entry.name.endswith('.xlsx'):
                is_have_excel = True
                print(f'{folder}下的Excel文件路径为：{entry.path}')
                # 打开当前文件
                wb = load_workbook(entry.path)
                # 遍历每一个Sheet
                for sheet_name in wb.sheetnames:
                    sheet = wb[sheet_name]
                    # 获取当前列名为货品编码的列序号
                    code_index = ""
                    for column in sheet.iter_cols():
                        if column[0].value == good_code:
                            code_index = column[0].column
                            break
                    if code_index == "":
                        print(f'列名{good_code}在{entry.path}的文件中不存在！')
                        break
                    else:
                        folder_name_dict[folder] = True
                    # 遍历Sheet中的所有图片
                    for image in sheet._images:
                        # 获取图片中心行数，判断货品编码是哪一个
                        row_index = (int(((image.anchor._from.row + 1) + (image.anchor.to.row + 1)) / 2))
                        # 获取当前行的货品编码列的值(取中间值)
                        code = ""
                        if code_index != "":
                            code = str(sheet.cell(row=row_index, column=code_index).value)
                        # 获取图片格式
                        img_format = image.format
                        # 这个if else只是命名规则，不重要
                        if code not in name_dict:
                            name_dict[code] = 1
                        else:
                            name_dict[code] = name_dict[code] + 1
                        save_path = f"./images/{code}-{name_dict[code]}.{img_format}"
                        # 保存
                        file = open(save_path, "wb")
                        file.write(image.ref.getvalue())
                        file.close()
                        # 压缩图片
                        compress_and_save_image(save_path)
                        img_num += 1
                    break
                # 关闭文件对象
                wb.close()
    except FileNotFoundError:
        # 处理文件未找到异常
        print(f'{folder}文件夹未找到！')
        extract_images(good_code)
    except Exception as e:
        # 处理其他异常
        print("提取图片异常:", e)
    if not is_have_excel:
        print(f'{folder}文件夹内未找到Excel文件！')
        folder_name_dict[folder] = True


# 压缩图片
def compress_and_save_image(image_path):
    # 打开原始图片
    original_image = Image.open(image_path)
    # 检查文件大小，并根据需要进行进一步压缩，压缩到1M
    if os.path.getsize(image_path) > 1024 * 1024:
        size = os.path.getsize(image_path)
        # 压缩到1mb需要压缩的比例(百分比)
        quality = math.floor(((1024 * 1024) / size) * 100)
        original_image.save(image_path, optimize=True, quality=quality)
    original_image.close()


# v1.0：此版本是针对于图片分布不规则的情况，提取图片速度尚且较慢
# v1.1：此版本是针对于图片集中分布在一列的情况，能更快提取图片出来。
# v1.2：此版本解决图片位于Excel边界时存在的问题，只要图片中心行在这一行，就可以匹配相应的国家编码，同时不用去遍历，直接获取图片。
# v1.3：此版本是让用户自己输入指定的文件夹，增加异常交互。
# v1.4：此版本增加了对1MB以上图片的压缩，解决了多图片在同一单元格的问题。
if __name__ == '__main__':
    print("开始提取......")
    # 创建存放文件夹
    create_folder()
    # 提取图片
    extract_images(False)
    # 最后加入输入语句，以阻塞程序的执行
    input("按下任意键以关闭程序")

快手NS sig3签名算法（2025年1月） sh_moranliunian 蜘蛛侠网络爬虫后端 python 爬虫算法
kuaishou/__NS_sig3.js源码见文章最后。python中调用示例importjsonimportsysimportrequestsimportosimportexecjsimporthashlibimportdatetimefromCookieUtilimportCookieUtilfromfake_useragentimportUserAgentnormal_js=execjs.
通过爬虫方式实现视频号助手发布视频 sh_moranliunian 蜘蛛侠 python 网络协议爬虫网络爬虫后端
1、将真实的cookie贴到解压后目录中cookie.txt文件里，修改python代码里的user_agent和video_path,cover_path等变量的值，最后运行python脚本即可；2、运行之前根据import提示安装一些常见依赖，比如requests等；3、2025年1月份最新版；代码如下：importjsonimporttimeimportrequestsimportosimp
python的with中的变量是不是局部作用域？Python上下文管理器-with使用? 梦境之冢 python 开发实战问题解决 python 开发语言
一、Python中的with语句并不创建新的作用域。‌在with语句中定义的变量，其作用域并不局限于with语句块内部，而是在整个作用域内都是可见的。这意味着在with语句块外部也可以访问这些变量，不会因为with语句的存在而创建新的作用域。例如，以下代码中的变量a在with语句块外部也可以访问：withopen('test.txt','w')asfout:a=12line='testline\n
【零散技术】MAC 安装多版本node Odoo穆尘前端 macos
时间是我们最宝贵的财富,珍惜手上的每个时分不同前端项目运行的node版本不一致，会导致无法运行，就像Odoo也需要依据版本使用对应的python环境。python可以用conda随时切换版本，那么Node可以吗？答案是肯定的。1、安装n（类似于conda的工具，单一字符还是很特别）npminstall-gn2、安装nodesudo-En14.21.3版本参照表Node.jsVersionRelea
OpenAI 函数调用功能入门 AI火箭 chatgpt openai
Javascript版Langchain入门作者：AI小火箭的HB我是AI小火箭的HB，我探索和写作人工智能和语言交叉点的所有事物，范围从LLM，聊天机器人，语音机器人，开发框架，以数据为中心的潜在空间等。介绍LangChain是一个开源Python库，用于构建由大型语言模型（LLM）支持的应用程序。它提供了一个框架，将LLM与其他数据源（如互联网或个人文件）连接起来，允许开发人员将多个命令链接在
使用Python爬取短视频平台视频和评论数据 Python爬虫项目 2025年爬虫实战项目 python 音视频开发语言爬虫
随着短视频平台如抖音、快手、YouTube等的普及，短视频成为了人们表达、记录和消费信息的重要媒介。这些平台上的海量视频和评论数据为市场分析、用户研究和内容优化提供了重要支持。本篇博客将详细讲解如何使用Python抓取短视频平台的视频和评论数据，内容涵盖目标分析、技术选型、代码实现以及防反爬策略，力求全面覆盖数据抓取过程中的技术细节。目录一、短视频平台数据抓取的背景与需求1.为什么需要抓取短视频数
Google Protocol Buffers的.NET与Python 步、步、为营 .net python php
一、引言大家好，我是[博主名字]，一直致力于探索各种有趣且实用的技术，今天想和大家分享在项目开发中遇到的一个十分强大的工具——GoogleProtocolBuffers，以及它在.NET与Python这两种不同语言环境中的应用和实践。在当今的软件开发领域，我们常常会面临跨语言通信的挑战。比如，一个大型项目可能由多个不同语言编写的模块组成，.NET凭借其强大的生态系统和对Windows平台的深度集成
基于Python增加抖音视频播放量的代码 sh_moranliunian 蜘蛛侠网络爬虫后端 python 爬虫
一、思路通过发送HTTP请求来实现这一功能。代码主要功能的简要介绍：1.`get_ttwid`：这个函数用于获取`ttwid`，它是通过向字节跳动的接口发送POST请求，并从响应的cookie中提取`ttwid`值。2.`get_web_id`：这个函数用于获取`web_id`，它是通过向某个API发送POST请求，并从响应中提取`web_id`。3.`get_ms_token`：这个函数生成一个
VSCode 创建Python 项目(最简单，最少步骤，无痛从pycharm迁移项目) 以史为镜 vscode ide 编辑器
第一步：下载下载地址：https://code.visualstudio.com/docs/?dv=win64user第二步：配置2.1：VsCode设置中文按住键盘上的“Ctrl+Shift+P”组合键，打开命令面板。在命令面板中输入“ConfigureDisplayLanguage”。点击“ConfigureDisplayLanguage”选项。在弹出的语言选择列表中，选择“zh-cn”，代表
python中使用多进制 Long韵韵 python知识学习 python 开发语言
python中使用多进制在Python中，多进制数字即是非十进制数字，包括二进制、八进制和十六进制。使用这些进制的表示方法如下：1）二进制：通过前缀“Ob”或“0B”表示，例如0b1010表示二进制的1010，等于十进制的10。2）八进制：通过前缀“0o”或“0O”表示，例如0o12表示八进制的12，等于十进制的10。3）十六进制：通过前缀“0x”或“0X”表示，例如0xA表示十六进制的A，等于十
Python中的进制书写排骨教主@ 笔记
为了方便计算和书写，Python中整数可以用不同的进制方式书写，其格式为0+进制方式（通常为一个大写字母）+相应进制的数据。具体对应前缀如下二进制:0b/0B八进制:0O十进制:无十六进制:0x/0X
Python 库的记录 weixin_40895135 python
GitHub-jobbole/awesome-python-cn:Python资源大全中文版，内容包括：Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等环境管理管理Python版本和环境的工具p–非常简单的交互式python版本管理工具。pyenv–简单的Python版本管理工具。Vex–可以在虚拟环境中执行命令。vir
基于CNN-GRU-Attention混合神经网络的负荷预测方法（Python代码实现）宇哥预测优化代码学习神经网络 cnn gru
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述一、引言二、模型结构三、数据预处理四、模型训练与评估五、实验结果与分析六、结论与展望2运行结果3参考文献4Python代码实现及数据1概述基于CNN-GRU(convolutionalneuralnetworks-gaterecurrentunit)神经网络的电
Python进制 panyingwork Python python
Python进制数字默认是十进制0b或0B，二进制（[0,1]）：0b开头的数字（零b）0o或0O，八进制（[0,7]）：0o（零，小写o）0x或0X，十六进制（[0,9]与[A,F]）：0x（小写x）一、手动进制转换1.十进制转成其他进制十进制转二进制：除2取余，数字/2，包括最后的商，从下向上，取每一步计算的余数十进制转八进制：除8取余十进制转十六进制：除16取余2.其他进制转成十进制
Python极简计算器程序代码 EYYLTV python 开发语言
n=float(input("Enteranumber输入一个数字:"))m=float(input("Enteranumber输入一个数字:"))z=input("Enteranoperator输入一个运算符(+,-,*,/):")ifz==‘+’:a=n+mprint(a)elifz==‘-’:b=n-mprint(b)elifz==‘*’:c=n*mprint©elifz==‘/’:ifm=
FastAPI：一个贼快的Python Web框架程序媛千千 fastapi python
Python，作为一个强大而灵活的编程语言，提供了多种框架来简化Web开发过程。其中，FastAPI是一个很新但极其强大的库，它允许开发者以极简的代码高效地构建API。什么是FastAPI？FastAPI是一个现代、快速（高性能）的Web框架，用于构建API与Web应用程序。它基于标准Python类型提示这一特性，提供了多项功能，如数据验证、序列化、文档生成等。为什么选择FastAPI？速度：Fa
python 多线程无阻塞获取键盘按键檐上走过的猫
编程小白python多线程无阻塞获取键盘按键刚开始学，不喜勿喷，谢谢importsysimportttyimporttermiosimportosimportthreadingdefreadchar():fd=sys.stdin.fileno()old_settings=termios.tcgetattr(fd)try:tty.setraw(sys.stdin.fileno())ch=sys.st
Python3 【集合】项目实战：3 个新颖的学习案例李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享案例学习编程技巧
Python3【集合】项目实战：3个新颖的学习案例以下是3个应用“Python集合”知识的综合应用项目，这些项目具有新颖性、前瞻性和实用性，每个项目都包含完整的代码、解释说明、测试案例和执行结果。基因序列比对文章推荐系统运行日志分析项目1：基因序列比对（集合运算与去重）项目描述在生物信息学中，比对两个基因序列的相似性。使用集合的交集和并集计算相似度。代码实现#基因序列（简化为字符串集合）seque
python列表推导式 Cheng. py 最全面 Python python list
Python的列表推导式又称(列表解析式子)提供了一种简明扼要方便的方法来创建列表一般结构是，一个中括号中，包含一个表达式，一个for语句，然后是0个或多个for或者if语句结构拆解:最简单的列表推导式[xforxinrange(1,8)]#1-7加判断条件的列表推导式[xforxinrange(1,8)ifx>5]#[6,7]
（25）python推导式创建序列、列表、字典+综合运用关关雎鸠儿 python
推导式创建序列推导式是从一个或者多个迭代器快速创建序列的一种方法。它可以将循环和条件判断结合，从而避免冗长的代码。推导式是典型的Python风格，会使用它代表你已经超过Python初学者的水平。列表推导式列表推导式生成列表对象，语法如下：[表达式foritemin可迭代对象]或者：{表达式foritemin可迭代对象if条件判断}>>>[xforxinrange(1,5)][1,2,3,4]>>>
python3多线程传参_python多线程怎么传送多个参数 weixin_39808803 python3多线程传参
对于python来说，作为解释型语言，Python的解释器必须做到既安全又高效。我们都知道多线程编程会遇到的问题，解释器要留意的是避免在不同的线程操作内部共享的数据，同时它还要保证在管理用户线程时保证总是有最大化的计算资源。而python是通过使用全局解释器锁来保护数据的安全性：python代码的执行由python虚拟机来控制，即Python先把代码(.py文件)编译成字节码(字节码在Python
python多线程并发加速 AI算法网奇 python宝典 mysql python基础数据库
目录python多线程并发加速多线程例子打印线程号，进程号由于Python的全局解释器锁（GIL）限制，在CPU密集型任务中多线程的效果并不理想，但对于I/O密集型任务，多线程仍然是有效的。python多线程并发加速python多线程并发遍历数据库，然后查询历史记录，然后分析数据查询100ms，这时需要3分钟，加了并发处理后，需要1.2分钟后来数据库加了索引，需要6秒就可以了，总结：加索引能带来3
Python键盘监听+多线程被嘎韭菜的编程小白键盘监听多线程 python
__author__='tjt'#binimportdatetimeimportthreadingimporttimefrompynput.keyboardimportListenerimportkb_upperevent=threading.Event()#实例化事件time_map={'start_time':0.0,'end_time':0.0,'total_time':0.0,'odd_e
Python语言的安全开发慕璃嫣包罗万象 golang 开发语言后端
Python语言的安全开发引言在信息技术迅速发展的今天，网络安全问题愈发凸显。随着Python语言的广泛应用，尤其是在数据分析、人工智能、Web开发等领域，其安全问题越来越受到重视。Python作为一门高效且易于学习的编程语言，虽然在开发过程中为我们提供了很多便利，但如果忽视了安全性，将可能导致严重的安全漏洞和数据泄露等问题。因此，本文将围绕Python语言的安全开发展开讨论，重点分析常见的安全问
获取PPT中的MSO格式图片报错 ♢.＊ ppt python
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！image.ext的报错ValueEr
知识图谱技术剖析 ♢.＊人工智能知识图谱大数据
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！一、引言在当今数字化信息爆炸的时代，如
python神经网络框架有哪些,python调用神经网络模型小明技术分享 python 神经网络深度学习
人工智能Python深度学习库有哪些由于Python的易用性和可扩展性，众多深度学习框架提供了Python接口，其中较为流行的深度学习库如下：第一：CaffeCaffe是一个以表达式、速度和模块化为核心的深度学习框架，具备清晰、可读性高和快速的特性，在视频、图像处理方面应用较多。Caffe中的网络结构与优化都以配置文件形式定义，容易上手，无须通过代码构建网络;网络训练速度快，能够训练大型数据集与S
python求一个数的阶乘_阶乘计算python weixin_39540725 python求一个数的阶乘
广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！问题本身很简单，主要是通过这个小问题来演示python的一些用法，例如测试代码运行时间、函数嵌套定义等等。fromtimeimporttimefrommathimportfactorialfromfunctoolsimportreducefromrandomimportrandintd
python上机_Python上机7 weixin_39575170 python上机
1.使用函数编写程序p1.py实现函数isOdd()，参数为整数，如果整数为奇数，返回True，否则返回False。然后在主程序中调用该函数，打印结果。2.使用函数编写程序p2.py实现函数isNum()，参数为一个字符串，如果这个字符串属于整数、浮点数或复数的表示，则返回True，否则返回False。在主程序输入一个字符串，调用该函数判断其是否为数字类型，并输出判断结果。参考代码：defisNu
2020-08-15 打开秋天的内核深度学习 python python tkinter
Python科学计算器本文分三部分特点介绍程序设计说明最终完整代码如果是高手，请直接跳过设计说明看最终完整代码。一、特点介绍这个计算器之所以称“Python科学计算器”，也绝非浪得虚名，肯定有它独特的地方才向大家推荐。1、具有科学计算功能。按照Python的方式输入，键盘按键和鼠标点击按钮混合输入。一般的计算例如12+34-56*78/910肯定不在话下，2\sqrt2
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

【Python小工具】Python小工具批量提取Excel图片

你可能感兴趣的:(Python,python,excel)