脑袋不灵光的小白羊

Python办公自动化【Word】

在Python中，可以使用 python-docx 库来自动化操作 Word文档，首先需要通过 pip3 安装该库：

pip3 install python-docx

为了避免歧义，接下来文章中Word 表示Word软件本身，Word文档表示Word 软件中的文档。

1.1 读写 Word 文档

与 Excel 工作簿类似，Word 文档也有两种不同的文件格式，分别是2003版或更早之前的版本使用的 *.doc 文件格式，以及 2007 版及之后的版本使用的 *.docx文件格式。*.docx文件格式基于XML （可扩展标记语言），在相同数量下，占用空间更小，兼容性更高。

python-docx 只支持操作 *.docx 文件格式的Word文档，虽然Word 有 *.doc与 *.docx两种文件格式，但目前使用的 Word 文档绝大多数是 *.docx 文件格式的。

如果遇到 *.doc 文件格式的Word文档，可以将其中的内容复制，粘贴到 *.docx文件格式的新文件中，再进行处理。

首先介绍如何通过 python-docx 创建一个新的空白的 Word文档：

from docx import Document

# 创建文档对象
document = Document()
# 保存文档对象 扩展名只可以使用*.docx
document.save("new.docx")

用 Document 方法创建文档对象，该文档对象对应着一个Word 文档；最后调用 save 方法传入具体的路径，将文档对象保存到本地。需要注意的是，在保存 Word 文档时，其扩展名必须使用 *.docx.

1.2 .doc 文件格式转换为 .docx 文件格式

如果希望将大量的 *.doc 文件格式的Word 文档转换为 *.docx文件格式，可以使用 pypiwin32 第三方库，该库可以调用 Windows 操作系统中的方法实现对 Word 文档的操作，但该库只可在 Windows 操作系统中安装与使用。

首先通过 pip3 安装 pypiwin32：

pip3 install  pypiwin32

安装完成后，通过 win32com 使用 pypiwin32 第三方库，实现将 Word文档的文件格式由 *.doc 转换为 *.docx。

from win32com import client

# *.doc 文件格式的Word文档的路径
doc_path = 'exist.doc'
docx_path = 'new_exist.docx'

# 获取Word 应用程序对象
Word = client.Dispatch('Word.Application')
# 打开对应的 Word文档
doc = Word.Documents.Open(doc_path)
# 另存为 *.docx 文件格式，参数 12 表示 *.docx 文件格式
doc.SaveAs(docx_path, 12)
# 关闭原来的 Word文档
doc.Close()
# 退出Word 软件
Word.Quit()

上述代码只演示了如何将一个Word 文档的 *.doc文件格式转为 *.docx 文件格式，如果需要将大量的 *.doc文件格式的Word 文档进行格式转换，使用 Python中的循环（while语句或者 for语句）即可。

1.3 读取Word 文档中的段落

Word 文档中存在段落、图片、表格等多种不同类型的数据，本节介绍如何读取 Word 文档中的段落数据。

from docx import Document

# 获取文档
doc = Document("exist.docx")
# 遍历Word文档中的段落
for p in doc.paragraphs:
    # 输出word文档中的段落内容
    print(p.text)

简单而言，我们只需要明确如下概念即可：

利用 Document 方法获取 Word 文档对象。
Paragraph 对象表示 Word 文档中的段落对象。
Paragraph 对象中的 text 对象表示段落中具体的文本内容。

1.4 读取 Word 文档中的表格

读取 Word 中的表格数据，可以通过 python-docx 提供的 tables 属性读取，代码如下：

rom docx import Document

# 获取文档
doc = Document("table.docx")
# 获取 Word 文档中的所有表格
tables = doc.tables
# 选择第一个表格
table = tables[0]
values = []

# 遍历表格的每一行
for row in table.rows:
    # 遍历每一行中的单元格
    for cell in row.cells:
        # 将单元格中的数据添加到list中
        values.append(cell.text)
    value = ' '.join(values)
    print(value)
    values = []

有时需要对比两个非常相似的表格以找到不同之处，此时怎么做呢？要解决这个问题，可以先将两个 Word 文档中的表格内容读入二维列表中，然后对列表中的内容进行比对，最终找到两个表格不同之处所对应的行号和列号。

使用 deepdiff第三方库，该库可以高效地比较不同对象的内容，并返回差异的内容，以及差异的位置。首先通过 pip安装 deepdiff 第三方库：

pip install deepdiff

安装完成之后，编写比较两个表格分的代码:

from docx import Document
from deepdiff import DeepDiff


def get_doc_values(path):
    # 获取表格中的内容 返回二维数组
    doc = Document(path)
    tables = doc.tables
    table = tables[0]
    all_values = []
    for row in table.rows:
        values = []
        for cell in row.cells:
            # 将表格中单元格的值添加到values列表中
            values.append(cell.text)
        all_values.append(values)
    return all_values


table1 = get_doc_values("table.docx")
table2 = get_doc_values("table_modify.docx")

# 比较列表差异
ddiff = DeepDiff(table1, table2)
print(ddiff)

# 输出
'''
{'values_changed': {'root[2][1]': {'new_value': '1973', 'old_value': '1972'}, 'root[3][0]': 
{'new_value': 'JVAA', 'old_value': 'JAVA'}, 'root[3][1]': {'new_value': '1996', 'old_value': '1995'}}}
'''

1.5 将文字写入Word文档

写入文字类型数据开始，python-docx 提供了 add_paragrraph 方法将文字类型数据以段落形式添加到 Word 文档中，代码如下：

from docx import Document

# 写入文档
doc = Document()
# 添加标题
doc.add_heading("一级标题", level=1)
# 添加段落
p2 = doc.add_paragraph("第二个段落")
# 将新段落添加到已经有的段落之前
p1 = p2.insert_paragraph_before("第一个段落")

p3 = doc.add_paragraph("新段落")
# 追加内容
p3.add_run("加粗").bold = True
p3.add_run("以及")
p3.add_run("斜体").italic = True

doc.save("new_doc.docx")

1.6 将图片写入 Word文档

python-dock 提供了 add_picture 方法将图片添加到Word文档中：

from docx import Document
from docx.shared import Inches

doc = Document()
# 添加图片
doc.add_picture("1.jpg", width=Inches(1.25))
doc.save("new_pic.docx")

通过 width 或 height 参数设置插入Word文档中的图片大小，并通过 Inches 类来指定具体的大小，该类的度量单位是英寸。

1.7 将表格写入Word中

首先，python-docx 提供了 add_table 方法来创建空表格，此外，通过 style 属性还可以设置表格样式：

from docx import Document

doc = Document()
# 创建table
table = doc.add_table(rows=3, cols=4)
# 设置table样式
table.style = "Table Grid"

# 第一种方法 先获取行 再获取该行中对应的单元格
row = table.rows[0]
row.cells[0].text = "第一行第一列"

# 第二种方法 直接指行号和列号
cell = table.cell(0, 1)
cell.text = "第一行第一列"

doc.save('new3.docx')

如果将图片添加到表格中，将如何实现？
追加添加，代码如下：

# 获取表格中的单元格对象
cell = table.cell(1, 0)
# 获取单元格中的段落对象
p = cell.paragraphs[0]
# 获取追加对象
run = p.add_run()
run.add_picture("1.jpg", width=Inches(1.25))

doc.save("new3.docx")

1.8 插入有序列表与无序列表

有序列表与无序列表都可以通过 add_paragraph 方法插入Word文档中，它们需要通过 style 参数设置其样式：

from docx import Document

doc = Document()
# 有序列表
style = "List Number"
doc.add_paragraph("有序列表1", style=style)
doc.add_paragraph("有序列表2", style=style)
doc.add_paragraph("有序列表3", style=style)

# 无序列表
style = "List Bullet"
doc.add_paragraph("无序列表1", style=style)
doc.add_paragraph("无序列表2", style=style)
doc.add_paragraph("无序列表3", style=style)

doc.save("doc_list.docx")

修改Word 文档样式

2.1 文本格式

想要通过python-docx 控制Word文档样式，首先需要理解文本格式与样式的概念，这里先讨论文本格式：
python-docx 将文本格式分为块对象与内联对象两种。

1 块对象

块对象一般包括标题、段落、图片、表格、有序列表与无序列表。块对象的属性指定了块对象所在的位置，如缩进、段落之间的段间距等，常用的属性有 alignment（对齐方式）、index（缩进）、pace（行间距）等：

from docx import Document
from docx.enum.text import WD_ALIGN_PARAGRAPH

# 修改word文档样式
doc = Document()

p1 = doc.add_paragraph("水平居中对齐")
# 设置段落水平居中对齐
p1.paragraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTER

p2 = doc.add_paragraph("左对齐")
# 设置段落左对齐
p2.paragraph_format.alignment = WD_ALIGN_PARAGRAPH.LEFT

p3 = doc.add_paragraph("右对齐")
# 设置段落右对齐
p3.paragraph_format.alignment = WD_ALIGN_PARAGRAPH.RIGHT

doc.save('new.docx')

2 内联对象

块对象的所有内容都包括在内联对象中，一个块对象由一个或多个内联对象组成。内联对象一般包括文字、句子、段落等，通常通过内联对象的相关属相来指定字体的样式，如粗体、斜体、大小等：

from docx import Document
from docx.shared import Pt

p4 = doc.add_paragraph()
run = p4.add_run("内联对象")
font = run.font
# 设置字体大小
font.size = Pt(35)
# 设置字体为斜体
font.italic = True

doc.save('new.docx')

2.2 Word 文档样式

Word 文档中常见的样式有段落样式、字符样式、表格样式等，python-docx 库样式定义在 styles 属性中，但它并不包含 Word 中所有的样式。
下面简单使用 python-docx 的styles 属性定义样式：

from docx import *
from docx.shared import Pt

# 获取python-docx支持的所有样式
styles = doc.styles
# 选取style并设置style中的段落格式
style = styles["Heading 1"]
p_format = style.paragraph_format
# 设置左缩进
p_format.left_indent = Pt(25)
# 使用样式
p = doc.add_paragraph("使用style设置段落样式", style=style)

doc.save("doc_style.docx")

将 python-docx 库中支持的所有表格样式输出：

from docx import Document
from docx.enum.style import *

# 输出所有表格的样式
doc = Document()
styles = doc.styles
for style in styles:
  # 过滤表格样式
  if style.type == WD_STYLE_TYPE.TABLE:
    # 输出当前样式的样式名
    doc.add_paragraph(f"表格样式名称: {style.name}")
    # 创建表格并指定为当前样式
    table = doc.add_table(3, 3, style=style)
    # 将内容添加到第一行
    cells = table.rows[0].cells
    cells[0].text = "第一列内容"
    cells[1].text = "第二列内容"
    cells[2].text = "第三列内容"
    doc.add_paragraph("\n")

doc.save("doc_all_style_list.docx")

使用 Word 模板

Word 模板指包括固定格式设置和版式设置的 Word文件，通过模板文件，可以快速生成美观的Word 文档，而不再需要重新设置各种样式的参数。

3.1 创建 Word 模板文件

对于不同的使用情景，Word 默认提供的各种模板文件并不能满足所有要求，此时可以自行创建一个符合自身需求的模板文件

下面创建一个入职证明Word模板，它用于证明新员工成功入职，其创建过程主要分为如下几步：
（1）创建一个普通的空白 Word 文档，在 Word 文档中输入相应的内容：

（2）选中 Word文档中的部分内容，如图，选中“同志”一词前的下划线“_”，然后在“插入” 选项卡中创建一个域，WPS与Word都具有该功能。

（3）在“域”对话框的 “域名”列表框中选择“MergeField”，然后在“域名”文本框中输入对应的名称，最后单击“确定”

（4）至此，带有“《》”符号的域在Word模板中创建成功

3.2 使用Word 模板文件

使用域创建自定义 Word 模板的目的就是让程序来填充内容，通过 docx-mailmerge 第三方库将数据填充到 Word 模板文件中，不过在使用前，需要先安装 docx-mailmerge 库：

pip3 install docx-mailmerge

docx-mailmerge 库在安装完成后即可使用：

from mailmerge import MailMerge

template = "doc_templates.docx"

doc = MailMerge(template)

# 将内容添加到Word模板文件中 参数名与Word模板中的域名相同
doc.merge(
  name="二两",
  id="111222333",
  year="2021",
  month="8",
  day="30"
)

doc.write("doc_templates_new.docx")

3.3 快速生成千份劳动合同

有一个Excel 表格，其中记录了1000 位求职者的姓名，现在需要为每位求职者生成相应的合同，并将合同中乙方的名字填写为求职者的姓名，该工作如何完成呢？

回顾前面的知识，不难想到，第一步当然是将合同文件转为Word模板文件，将要填写的信息的位置转为域。注意域只能使用英文名。用户可以根据自身的需求为不同的域设置不同的样式：

import pandas as pd
from mailmerge import MailMerge

# 读取求职者基本信息Excel表
job_seekers = pd.read_excel('求职者.xlsx')
template = '合同.docx'
doc = MailMerge(template)

# 将数据填写到Word中
def merge(name):
    doc.merge(owner = '二两', # 甲方
              party_b = name, # 乙方，求职者姓名
              # 合同年月日
              year = '2022',
              month = '7',
              day = '29')
    doc.write(f'合同/{name}_合同.dock')
    
# 循环遍历求职者姓名
for i, name in job_seekers['name'].items():
    merge(name)
print('done!')

自动生成数据分析报告

4.1 处理Excel 数据

学生成绩数据如图所示，数据分析报告需要给出分数排在第一位的学生姓名及分数，此外还需要通过表格与柱状图展示出学生分数的排列情况。

首先生成学生成绩从大到小排序的柱状图：

import pandas as pd
import matplotlib.pyplot as plt


# 自动生成数据分析报告
students = pd.read_excel("student_score.xlsx")
# 就地排序
students.sort_values(by='Score', inplace=True, ascending=False)
# 绘制柱状图
plt.bar(students["Name"], students["Score"], color="orange")

plt.title("Student Score", fontsize=16)
plt.xlabel("Name")
plt.ylabel("Score")

# 重铺x轴标签
plt.xticks(students.Name, rotation='90')
# 紧凑型布局
plt.tight_layout()
# 保存图片
plt.savefig("student_score.png")

柱状图绘制完成后，接着获取分数排在第一位的学生信息。因为在绘制柱状图时已经通过 sort_values 方法对数据进行了排序，所以直接获取排在第一位的学生数据即可。
需要注意的是，用 sort_values 方法进行排序后的数据的下标并没有改变，此时直接通过下标获取的仍是原本排在第一位的数据，但是这并不是我们需要的。此时要么通过绝对位置获取数据，要么重新排序数据的下标，再通过下标获取数据：

# 数据虽然被排序 但数据下标并没有改变 直接通过下标获取的依旧是原本的数据
print("原始下标: ", students["Name"][0])

# 方法一 通过iloc方法获取绝对的位置
print("绝对位置: ", students.iloc[0, :]["Name"])
# 方法二 对下标重新排序再取其中第一位
students.reset_index(drop=True, inplace=True)
print("重新排序后的下标 ", students["Name"][0])

4.2 生成美观的数据分析报告

使用 python-docx 库来生成数据分析报告：

# 生成word文档
doc = Document()
doc.add_heading("数据分析报告", level=0)
# 绝对定位 获取分数排在第一位的学生信息
first_student = students.iloc[0, :]["Name"]
first_score = students.iloc[0, :]["Score"]

p = doc.add_paragraph("分数排在第一位的学生是: ")
# 设置为粗体
p.add_run(str(first_student)).bold = True
p.add_run(', 分数为 ')
p.add_run(str(first_score)).bold = True

p1 = doc.add_paragraph(f"总共有 {len(students['Name'])} 名学生参加了考试 学生考试总体情况为 ")

# 添加表格
table = doc.add_table(rows=len(students["Name"]) + 1, cols=2)

# 设置表格样式
table.style = "LightShading-Accent1"
table.cell(0, 0).text = "学生姓名"
table.cell(0, 1).text = "学生分数"

# 添加数据到表中
for i, (index, row) in enumerate(students.iterrows()):
  table.cell(i + 1, 0).text = str(row["Name"])
  table.cell(i + 1, 1).text = str(row["Score"])

# 添加图片
doc.add_picture("student_score.png")
doc.save("student_score_analyze.docx")
print("Done!")

python之pyttsx3实现文字转语音播报 l8947943 python问题语音识别人工智能 pyttsx3 python朗读
1.pyttsx3是什么pyttsx3是Python中的文本到语音转换库，可以实现文本的朗读功能。2.pyttsx3的安装pipinstallpyttsx33.pyttsx3的demoimportpyttsx3pyttsx3.speak("Areyouok?")pyttsx3.speak("最近有许多打工人都说打工好难")戴上耳机直接跑即可。是不是很简单！那如果我们想对读音的速率，中英文问题进行自
Python报错解决：img2pdf.AlphaChannelError: Refusing to work on images with alpha channel 定星照空 python 人工智能
img2pdf.AlphaChannelError:Refusingtoworkonimageswithalphachannel-solved解决img2pdf模块不能上传含alpha通道透明度的图片的问题解决img2pdf模块PNG图片转PDF文件因alpha通道报错问题文章目录前言一、AlphaChannelError为什么出现？二、该种报错解决方法1.方法一：转化其他格式图片2.方法二：去除
基于PyCATIA的工程图视图锁定工具开发实战解析 Python×CATIA工业智造 CATIA二次开发 python 自动化
引言本文针对CATIA工程图设计中视图误操作问题，基于PySide6与PyCATIA库开发了一款轻量化视图锁定工具。通过Python二次开发实现全视图/选定视图快速锁定、非模态交互界面及状态实时反馈功能，有效提升大型装配体工程图操作效率。文章深度解析代码架构设计、关键技术实现及工程应用价值，提供完整的开发方法论。一、工具功能与工程应用场景1.1核心功能模块功能模块技术指标应用场景全视图锁定批量操作
Python中Pyttsx3库实现文本转化成语音MP3格式文件定星照空 python
Pyttsx3库介绍pyttsx3库是一个功能强大且使用方便的Python本地文本转语音库。它不仅能在离线下将文本转换为语音MP3格式文件，也能在Windows、MacOS和Linux等多个操作系统上实现语音播报。同时，还可以调整语音播报的语速、音量和音色。安装与基本使用安装：cmd命令行中执行pipinstallpyttsx3。基本使用示例：importpyttsx3#初始化语音引擎engine
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
openai-agents 中custom example agent ZHOU_CAMP oi_agents 人工智能
代码pipshowopenai-agentsName:openai-agentsVersion:0.0.4Summary:OpenAIAgentsSDKHome-page:https://github.com/openai/openai-agents-pythonAuthor:Author-email:OpenAILicense-Expression:MITLocation:d:\soft\ana
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
Python 应用部署云端实战指南 —— AWS、Google Cloud 与 Azure 全解析清水白石008 python Python题库 python aws azure
Python应用部署云端实战指南——AWS、GoogleCloud与Azure全解析在当下云计算飞速发展的时代，将Python应用部署到云平台已成为大多数开发者和企业的首选。无论是构建Web服务、API接口，还是自动化任务调度，云平台都能为我们提供高可靠性、弹性伸缩与简便管理的优势。本文将详细阐述如何将Python应用分别部署到AWS、GoogleCloud与Azure，并介绍各平台下涉及的部署工
Python编程：为什么使用同步原语林十一npc Python语言 python 开发语言
Python编程：为什么使用同步原语1.同步原语同步原语：计算机科学中用于实现进程或线程之间同步的机制。目的：提供一种方法来控制多个进程或线程的执行顺序，确保他们以一致的方式访问共享资源在多线程/多进程编程中，多个执行单元可能同时访问共享资源，导致竞态条件。同步原语通过协调执行顺序，确保数据一致性和操作原子性2.Python核心同步原语同步原语作用适用场景模块Lock（互斥锁）确保同一时间只有一个
python函数闭包和递归_闭包和递归_个人文章 - SegmentFault 思否 weixin_39830313 python函数闭包和递归
js变量的作用域:全局作用域(全局变量):在函数外面声明的变量**生命周期(变量从声明到销毁)：页面从打开到关闭.局部作用域(局部变量):在函数里面声明的变量**生命周：开始调用函数到函数执行完毕1.闭包使用介绍1.闭包介绍(closure)1.1闭包：是一个可以在函数外部访问函数内部变量的函数->闭包是函数1.2闭包作用：可以在函数外部访问函数内部变量->延长局部变量的生命周期1.3闭包语法：-
python函数闭包和递归_python函数基础3--闭包 + 递归 + 函数回调 weixin_39532019 python函数闭包和递归
一、闭包1.函数嵌套defouter():print("外层函数")definner():print("内层函数")returninner()outer()函数嵌套流程图2.闭包闭包的表现形式：函数里面嵌套函数，外层函数返回内层函数的函数名，这种情况就称之为闭包defouter():print("外层函数")definner():print("内层函数")returninnerret=outer(
python中的递归、回调函数以及闭包总结敲代码敲到头发茂密 Python成长之路 python 开发语言
这里写目录标题一、递归例1：利用递归函数计算1到10的和例2：利用递归函数计算10的阶乘二、回调函数特别注意：在函数中的调用函数分为以下情况：1、同步回调2、异步回调三、闭包一、递归作用：在函数内部调用自己若干次例1：利用递归函数计算1到10的和defsum_num(num):ifnum>=1:sum=num+sum_num(num-1)else:sum=0returnsumprint(sum_n
使用Pygame实现记忆拼图游戏点我头像干啥 Ai pygame python 开发语言
引言记忆拼图游戏是一种经典的益智游戏，玩家需要通过翻转卡片来匹配相同的图案。这类游戏不仅能够锻炼玩家的记忆力，还能带来很多乐趣。本文将详细介绍如何使用Pygame库来实现一个简单的记忆拼图游戏。我们将从Pygame的基础知识开始，逐步构建游戏的各个部分，最终完成一个完整的游戏。1.Pygame简介Pygame是一个用于编写视频游戏的Python库，它基于SDL库（SimpleDirectMedia
《Python实战进阶》No28: 使用 Paramiko 实现远程服务器管理带娃的IT创业者 Python实战进阶 python 服务器开发语言
No28:使用Paramiko实现远程服务器管理摘要在现代开发与运维中，远程服务器管理是必不可少的一环。通过SSH协议，我们可以安全地连接到远程服务器并执行各种操作。Python的Paramiko模块是一个强大的工具，能够帮助我们实现自动化任务，如代码部署、批量命令执行和文件传输。本集将深入讲解Paramiko的核心功能，并通过实战案例展示如何高效管理远程服务器。核心概念和知识点SSH协议的基本原
.gitlab-ci.yml 配置文件详解程序媛夏天 Git gitlab ci/cd .gitlab-ci.yml
个人主页：不爱吃糖的程序媛‍♂️作者简介：前端领域新星创作者、CSDN内容合伙人，专注于前端各领域技术，成长的路上共同学习共同进步，一起加油呀！✨系列专栏：前端面试宝典、JavaScript进阶、vue实战资料领取：前端进阶资料以及文中源码可以在公众号“不爱吃糖的程序媛”领取git工具文档说明：https://docs.gitlab.com/ee/ci/yaml/gitlab_ci_yaml.ht
python八股（—） --FBV，CBV suohanfjiusbis 数据库 python
引言FBV是面向函数的视图。defFBV(request):ifrequest.method=='GET':returnHttpResponse("GET")elifrequest.method=='POST':returnHttpResponse("POST")CBV是面向类的视图。classCBV(View):defget(self,request):returnHttpResponse("G
【纯职业小组——思维】 Kent_J_Truman 蓝桥杯算法
题目思路第十五届蓝桥杯省赛PythonB组H题【纯职业小组】题解（AC）_蓝桥杯纯职业小组-CSDN博客代码#includeusingnamespacestd;usingll=longlong;intmain(){ios::sync_with_stdio(0);cin.tie(0);intt;cin>>t;while(t--){intn;llk;cin>>n>>k;unordered_maph;f
第十五届蓝桥杯省赛PythonB组B题【数字串个数】题解（AC）信奥郭老师蓝桥杯职场和发展
设n=10000n=10000n=10000。法一枚举333的个数以及777的个数，假设333的个数为iii，777的个数为jjj，那么非3,73,73,7的个数即为n−i−jn-i-jn−i−j。在长度为nnn的字符串中选取iii的方案数为CniC^i_nCni，在剩余n−in-in−i个位置选取jjj个的方案数为Cn−ijC^j_{n-i}Cn−ij，剩余位置个数为n−i−jn-i-jn−i−
ModuleNotFoundError: No module named ‘h5py‘ Hardess-god python
到ModuleNotFoundError:Nomodulenamed'h5py'错误表明Python环境中没有安装h5py模块。h5py是一个用于处理HDF5二进制数据格式的Python接口，广泛用于大规模存储和操纵数据。解决方案：安装h5py要解决这个问题，你需要在你的Python环境中安装h5py。以下是如何在不同环境中安装h5py的步骤：使用pip安装如果你使用的是pip包管理器，可以通过以
CSP-J备考冲刺必刷题（C++） | AcWing 1253 家谱热爱编程的通信人 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】Acwing：1253.家谱-AcWing题库
蓝桥杯2024年第十五届省赛真题-魔法巡游（Python）罄竹_ python刷题 python 蓝桥杯算法
前言本文参考了FJ_EYoungOneC的文章思路，并且修改了该文章的某些理解上的偏差。一、题目题目来源：dotcpp题目描述在蓝桥王国中，两位魔法使者，小蓝与小桥，肩负着维护时空秩序的使命。他们每人分别持有N个符文石，这些石头被赋予了强大的力量，每一块上都刻有一个介于1到109之间的数字符号。小蓝的符文石集合标记为s1,s2,...,sN，小桥的则为t1,t2,...,tN。两位魔法使者的任务是
想使用dify实现docx文档的自动生成？试了一圈，感觉还是根据python-docx更靠谱几道之旅人工智能智能体及数字员工人工智能
前言：文档自动生成的需求痛点在软件开发过程中，需求文档、设计文档等材料的编写是每个开发者都绕不开的工作。最近笔者接到一个需要批量生成标准化需求文档的任务，尝试了目前热门的低代码工具Dify后，发现对于稍微复杂格式的文档生成需求（例如文本居中这么简单的需求），最终还是回归到基于python-docx库的解决方案。本文将分享两种技术路线的对比实践。一、Dify的踩坑经历我尝试了markdown转doc
python中列表排序 hedgehog" python python list
Python中列表的排序方法1.sort()方法2.sorted()方法========================================1.sort()函数，无返回值主要参数：（1）key:用来进行比较的元素，指定可迭代对象的一个元素作为参数来进行排序。（2）reverse:排序规则。reverse=True降序排序reverse=False升序排序（默认）示例1：list1=[5
python 列表排序 rainynights Python
在我们实际使用中，对于列表的操作是十分常见的。对于列表的数据，在很多特殊的情况下我们需要对列表内的数据进行排列以达到我们特定的显示需求。今天，我们一起看一下python中关于列表排序的一些知识。有些时候我们希望对列表进行排序后，列表可以保存我们排序后的结果，但是很多情况下我们只是希望通过列表的排序，临时的显示排序结果而已。所以对于列表的排序可以分为永久性的排序和临时性的排序。sort()sort(
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南 m0_57781768 python langchain 搜索引擎
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南引言在人工智能和自然语言处理领域，利用大语言模型（LLM）构建复杂的问答（Q&A）系统是一个重要应用。检索增强生成（RetrievalAugmentedGeneration，RAG）是一种技术，通过将模型知识与额外数据结合来增强LLM的能力，使其能够回答关于特定源信息的问题。这些应用不仅限于公开数据，还可以处理私有数据和模
华为OD机试 - 相对开音节 - 正则表达式（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od 正则表达式 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述相对开音节构成的结构为辅音+元音（aeiou）+辅音(r除外)+
华为OD机试 - 数列描述 - 动态规划（Python/JS/C/C++ 2024 B卷 100分）哪吒华为od 动态规划 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述有一个数列a[N](N=60)，从a[0]开始，每一项都是一个数
华为OD机试 - 输出单向链表中倒数第k个结点 - 双指针（Python/JS/C/C++ 2024 B卷 100分）哪吒华为od 链表 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述输入一个单向链表，输出该链表中倒数第k个结点，链表的倒数第1个结
华为OD机试 - 图片整理（Python/JS/C/C++ 2024 B卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述Lily上课时使用字母数字图片教小朋友们学习英语单词，每次都需要
华为OD机试 - 宜居星球改造计划 - 图的多源BFS（Python/JS/C/C++ 2023 B卷 100分）哪吒华为od 宽度优先 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述2XXX年，人类通过对火星的大气进行宜居改造分析，使得火星已在理
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo