QuietNightThought

为什么是LangChain?

文章目录

一、前言
二、认识langchain
- 1. langchain的主要组成
- 2. 总览LangChain
- 2. LangChain的六大核心模块
- - 1. Models：模型统一接口
  - 2. `Prompts`：管理 LLM 输入
  - 3. `Chains`：将 LLM 与其他组件相结合，执行多个chain
  - 4. `Indexes`：访问外部数据
  - - a. Loader 加载器
    - b. `Document` 文档(解决加载数据超过模型最大输入) 与 `Text Spltters` 文本分割
    - d. Vectorstores 向量数据库
    - e. Embedding
  - 5. `Memory`：记住以前的对话
  - 6. `Agents`：访问其他工具，自定义agent中所使用的工具
三、经典示例
- 1. 最简单的交互
- 2. 构建本地知识库问答机器人
- 3. 让输出内容结构化起来
- 4. 使用 Hugging Face 模型
- 4. 通过自然语言执行SQL命令

一、前言

我们知道因为一些不得已的原因，一些国外比较优秀的技术，我们不能看到，比如，如果我们想要借助 OpenAI 或 Hugging Face 创建基于大语言模型的应用程序。若非一些特殊方法，是难以实现的。从cahtgpt发布到今天不过一年时间，市面上的LLM已经百花齐放，不得不感慨技术革命的速度，为了能轻松构建大语言模型应用。不得不提起一个非常强大的第三方开源库：LangChain 。
官方文档
这个库目前非常活跃，已经67Kstart了，每天都在迭代，更新速度飞快。

LangChain 是一个我们与大模型互动的一个桥梁。他主要拥有 2 个能力：

作为大模型与本地数据的一个器哦啊两联系起来，也就是将 LLM 模型与外部数据源进行连接
让开发者与 LLM 模型进行更加友好的交互

而且：LangChain 是一个旨在帮助您轻松构建大语言模型应用的框架，它可以帮助我们：

为各种不同基础模型提供统一接口（参见Models）
帮助管理提示的框架（参见Prompts），能够实现，多个prompt 配合使用。
一套中心化接口，用于处理长期记忆（Memory）、外部数据（Indexes）、其他 LLM（Chains）以及 LLM 无法处理的任务的其他代理（例如，计算或搜索）。
LLM 模型：Large Language Model，大型语言模型

LangChain是一个用于开发由语言模型驱动的应用程序的框架。它使应用程序能够:
具有上下文意识:将语言模型与上下文源(提示指令，少量示例，基于其响应的内容等)联系起来。
推理:依靠语言模型进行推理(关于如何根据提供的上下文进行回答，采取什么行动等)。
朗链的主要价值支柱有:
组件:用于处理语言模型的抽象，以及每个抽象的实现集合。组件是模块化的，易于使用，无论你

二、认识langchain

1. langchain的主要组成

LangChain 6大核心模块：

Models：从不同的 LLM 和嵌入模型中进行选择
Prompts：管理 LLM 输入
Chains：将 LLM 与其他组件相结合
Indexes：访问外部数据
Memory：记住以前的对话
Agents：访问其他工具

2. 总览LangChain

langchain是个优雅的框架。

Models：从不同的 LLM 和嵌入模型中进行选择
支持多种模型接口，比如 OpenAI、Hugging Face、AzureOpenAI …
Fake LLM，用于测试
缓存的支持，比如 in-mem（内存）、SQLite、Redis、SQL用量记录
支持流模式（就是一个字一个字的返回，类似打字效果）

Prompts：管理 LLM 输入
Prompt管理，支持各种自定义模板
拥有大量的文档加载器，比如 Email、Markdown、PDF、Youtube …

Indexes：访问外部数据
对索引的支持
文档分割器
向量化
对接向量存储与搜索，比如 Chroma、Pinecone、Qdrand

Chains：将 LLM 与其他组件相结合
LLMChain
各种工具Chain
LangChainHub

2. LangChain的六大核心模块

1. Models：模型统一接口

各种类型的模型和模型集成，比如OpenAI的各个API/GPT-4等等，为各种不同基础模型提供统一接口，也就是说在调用模型的时候，我们可以只通过一个入口：
比如：这里以 ChatGPT为例，因为特殊原因，api的key，秘钥这些东西需要申请。

import os
os.environ["OPENAI_API_KEY"] = '你的api key'
from langchain.llms import OpenAI
 
llm = OpenAI(model_name="text-davinci-003",max_tokens=1024)
llm("啥是人工智能")

# 可以选择的模型。以及模型的最大输入 token
        model_token_mapping = {
            "gpt-4": 8192,
            "gpt-4-0314": 8192,
            "gpt-4-0613": 8192,
            "gpt-4-32k": 32768,
            "gpt-4-32k-0314": 32768,
            "gpt-4-32k-0613": 32768,
            "gpt-3.5-turbo": 4096,
            "gpt-3.5-turbo-0301": 4096,
            "gpt-3.5-turbo-0613": 4096,
            "gpt-3.5-turbo-16k": 16385,
            "gpt-3.5-turbo-16k-0613": 16385,
            "text-ada-001": 2049,
            "ada": 2049,
            "text-babbage-001": 2040,
            "babbage": 2049,
            "text-curie-001": 2049,
            "curie": 2049,
            "davinci": 2049,
            "text-davinci-003": 4097,
            "text-davinci-002": 4097,
            "code-davinci-002": 8001,
            "code-davinci-001": 8001,
            "code-cushman-002": 2048,
            "code-cushman-001": 2048,
        }

2. `Prompts`：管理 LLM 输入

from langchain import PromptTemplate, FewShotPromptTemplate

examples = [
    {
   "word": "高兴", "antonym": "悲伤"},
    {
   "word": "高大", "antonym": "矮小"},
]

example_template = 
"""
词语: {word}
反义词: {antonym}\n
"""

example_prompt = PromptTemplate(
    input_variables=["word", "antonym"],
    template=example_template,
)

few_shot_prompt = FewShotPromptTemplate(
    examples=examples,
    example_prompt=example_prompt,
    prefix="给出输入词语的反义词",
    suffix="词语: {input}\n反义词:",
    input_variables=["input"],
    example_separator="\n",
)

few_shot_prompt.format(input="美丽")
#上面的代码将生成一个提示模板，并根据提供的示例和输入组成以下提示：

#给出输入词语的反义词

#词语: 高兴
#反义词: 悲伤


#词语: 高大
#反义词: 矮小

#词语: 美丽
#反义词:

3. `Chains`：将 LLM 与其他组件相结合，执行多个chain

from langchain.llms import OpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.chains import SimpleSequentialChain

# location 链
llm = OpenAI(temperature=1)
template = """Your job is to come up with a classic dish from the area that the users suggests.
% USER LOCATION
{user_location}

YOUR RESPONSE:
"""
prompt_template = PromptTemplate(input_variables=["user_location"], template=template)
location_chain = LLMChain(llm=llm, prompt=prompt_template)

# meal 链
template = """Given a meal, give a short and simple recipe on how to make that dish at home.
% MEAL
{user_meal}

YOUR RESPONSE:
"""
prompt_template = PromptTemplate(input_variables=["user_meal"], template=template)
meal_chain = LLMChain(llm=llm, prompt=prompt_template)

# 通过 SimpleSequentialChain 串联起来，第一个答案会被替换第二个中的user_meal，然后再进行询问
overall_chain = SimpleSequentialChain(chains=[location_chain, meal_chain], verbose=True)
review = overall_chain.run("Rome")

4. `Indexes`：访问外部数据

访问外部数据，不得不介绍几个额外的，功能，就是langchain自带的几个模块。配合这几个小模块实现，外部数据的访问

a. Loader 加载器

这个就是从指定源进行加载数据的。比如：文件夹 DirectoryLoader、Azure 存储 AzureBlobStorageContainerLoader、CSV文件 CSVLoader、印象笔记 EverNoteLoader、Google网盘 GoogleDriveLoader、任意的网页 UnstructuredHTMLLoader、PDF PyPDFLoader、S3 S3DirectoryLoader/S3FileLoader、Youtube YoutubeLoader 等等，上面只是简单的进行列举了几个，官方提供了超级的多的加载器供你使用。
关于这里的官方介绍

#示例：
from langchain.document_loaders import UnstructuredFileLoader
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain import OpenAI

# 导入文本
loader = UnstructuredFileLoader("/content/sample_data/data/lg_test.txt")
# 将文本转成 Document 对象
document = loader.load()
print(f'documents:{len(document)}')

b. `Document` 文档(解决加载数据超过模型最大输入) 与 `Text Spltters` 文本分割

当使用loader加载器读取到数据源后，数据源需要转换成 Document 对象后，后续才能进行使用。
Text Spltters ，文本分割就是用来分割文本的。为什么需要分割文本？因为我们每次不管是做把文本当作 prompt 发给 openai api ，还是还是使用 openai api embedding 功能都是有字符限制的。

#示例：

from langchain.document_loaders import UnstructuredFileLoader
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain import OpenAI

# 导入文本
loader = UnstructuredFileLoader("/content/sample_data/data/lg_test.txt")
# 将文本转成 Document 对象
document = loader.load()
print(f'documents:{len(document)}')

# 初始化文本分割器
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size = 500,
    chunk_overlap = 0
)

# 切分文本
split_documents = text_splitter.split_documents(document)
print(f'documents:{len(split_documents)}')

# 加载 llm 模型
llm = OpenAI(model_name="text-davinci-003", max_tokens=1500)

# 创建总结链
chain = load_summarize_chain(llm, chain_type="refine", verbose=True)

# 执行总结链，（为了快速演示，只总结前5段）
chain.run(split_documents[:5])

这里有几个参数需要注意：

文本分割器的 chunk_overlap 参数
这个是指切割后的每个 document 里包含几个上一个 document 结尾的内容，主要作用是为了增加每个 document 的上下文关联。比如，chunk_overlap=0时，第一个 document 为 aaaaaa，第二个为 bbbbbb；当 chunk_overlap=2 时，第一个 document 为 aaaaaa，第二个为 aabbbbbb。
chain 的 chain_type 参数

这个参数主要控制了将 document 传递给 llm 模型的方式，一共有 4 种方式：
stuff: 这种最简单粗暴，会把所有的 document 一次全部传给 llm 模型进行总结。如果document很多的话，势必会报超出最大 token 限制的错，所以总结文本的时候一般不会选中这个。
map_reduce: 这个方式会先将每个 document 进行总结，最后将所有 document 总结出的结果再进行一次总结。
refine: 这种方式会先总结第一个 document，然后在将第一个 document 总结出的内容和第二个 document 一起发给 llm 模型在进行总结，以此类推。这种方式的好处就是在总结后一个 document 的时候，会带着前一个的 document 进行总结，给需要总结的 document 添加了上下文，增加了总结内容的连贯性。
map_rerank: 这种一般不会用在总结的 chain 上，而是会用在问答的 chain 上，他其实是一种搜索答案的匹配方式。首先你要给出一个问题，他会根据问题给每个 document 计算一个这个 document 能回答这个问题的概率分数，然后找到分数最高的那个 document ，在通过把这个 document 转化为问题的 prompt 的一部分（问题+document）发送给 llm 模型，最后 llm 模型返回具体答案。

d. Vectorstores 向量数据库

因为数据相关性搜索其实是向量运算。所以，不管我们是使用 openai api embedding 功能还是直接通过向量数据库直接查询，都需要将我们的加载进来的数据 Document 进行向量化，才能进行向量运算搜索。转换成向量也很简单，只需要我们把数据存储到对应的向量数据库中即可完成向量的转换。
官方也提供了很多的向量数据库供我们使用。

#示例：
from langchain.vectorstores import Chroma

# 持久化数据
docsearch = Chroma.from_documents(documents, embeddings, persist_directory="D:/vector_store")
docsearch.persist()

# 加载数据
docsearch = Chroma(persist_directory="D:/vector_store", embedding_function=embeddings)

e. Embedding

用于衡量文本的相关性。这个也是 OpenAI API 能实现构建自己知识库的关键所在。
他相比 fine-tuning 最大的优势就是，不用进行训练，并且可以实时添加新的内容，而不用加一次新的内容就训练一次，并且各方面成本要比 fine-tuning 低很多。

5. `Memory`：记住以前的对话

使用Memory实现一个带记忆的对话机器人

from langchain.memory import ChatMessageHistory
from langchain.chat_models import ChatOpenAI

chat = ChatOpenAI(temperature=0)

# 初始化 MessageHistory 对象
history = ChatMessageHistory()

# 给 MessageHistory 对象添加对话内容
history.add_ai_message("你好！")
history.add_user_message("中国的首都是哪里？")

# 执行对话
ai_response = chat(history.messages)
print(ai_response)

6. `Agents`：访问其他工具，自定义agent中所使用的工具

自定义agent中所使用的工具

from langchain.agents import initialize_agent, Tool
from langchain.agents import AgentType
from langchain.tools import BaseTool
from langchain.llms import OpenAI
from langchain import LLMMathChain, SerpAPIWrapper

llm = OpenAI(temperature=0)

# 初始化搜索链和计算链
search = SerpAPIWrapper()
llm_math_chain = LLMMathChain(llm=llm, verbose=True)

# 创建一个功能列表，指明这个 agent 里面都有哪些可用工具，agent 执行过程可以看必知概念里的 Agent 那张图
tools = [
    Tool(
        name = "Search",
        func=search.run,
        description="useful for when you need to answer questions about current events"
    ),
    Tool(
        name="Calculator",
        func=llm_math_chain.run,
        description="useful for when you need to answer questions about math"
    )
]

# 初始化 agent
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)

# 执行 agent
agent.run("Who is Leo DiCaprio's girlfriend? What is her current age raised to the 0.43 power?")

三、经典示例

1. 最简单的交互

用 LangChain 加载 OpenAI 的模型，并且完成一次问答。我们需要先设置我们的 openai 的 key，这个 key 可以在用户管理里面创建。

import os
os.environ["OPENAI_API_KEY"] = '你的api key'
然后，我们进行导入和执行
from langchain.llms import OpenAI

llm = OpenAI(model_name="text-davinci-003",max_tokens=1024)
llm("怎么评价人工智能")

2. 构建本地知识库问答机器人

从本地读取多个文档构建知识库，并且使用 Openai API 在知识库中进行搜索并给出答案。

from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import CharacterTextSplitter
from langchain import OpenAI
from langchain.document_loaders import DirectoryLoader
from langchain.chains import RetrievalQA

# 加载文件夹中的所有txt类型的文件
loader = DirectoryLoader('/content/sample_data/data/', glob='**/*.txt')
# 将数据转成 document 对象，每个文件会作为一个 document
documents = loader.load()

# 初始化加载器
text_splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=0)
# 切割加载的 document
split_docs = text_splitter.split_documents(documents)

# 初始化 openai 的 embeddings 对象
embeddings = OpenAIEmbeddings()
# 将 document 通过 openai 的 embeddings 对象计算 embedding 向量信息并临时存入 Chroma 向量数据库，用于后续匹配查询
docsearch = Chroma.from_documents(split_docs, embeddings)

# 创建问答对象
qa = RetrievalQA.from_chain_type(llm=OpenAI(), chain_type="stuff", retriever=docsearch.as_retriever(), return_source_documents=True)
# 进行问答
result = qa({"query": "科大讯飞今年第一季度收入是多少？"})
print(result)

3. 让输出内容结构化起来

from langchain.output_parsers import StructuredOutputParser, ResponseSchema
from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI

llm = OpenAI(model_name="text-davinci-003")

# 告诉他我们生成的内容需要哪些字段，每个字段类型式啥
response_schemas = [
    ResponseSchema(name="bad_string", description="This a poorly formatted user input string"),
    ResponseSchema(name="good_string", description="This is your response, a reformatted response")
]

# 初始化解析器
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

# 生成的格式提示符
# {
#	"bad_string": string  // This a poorly formatted user input string
#	"good_string": string  // This is your response, a reformatted response
#}
format_instructions = output_parser.get_format_instructions()

template = """
You will be given a poorly formatted string from a user.
Reformat it and make sure all the words are spelled correctly

{format_instructions}

% USER INPUT:
{user_input}

YOUR RESPONSE:
"""

# 将我们的格式描述嵌入到 prompt 中去，告诉 llm 我们需要他输出什么样格式的内容
prompt = PromptTemplate(
    input_variables=["user_input"],
    partial_variables={"format_instructions": format_instructions},
    template=template
)

promptValue = prompt.format(user_input="welcom to califonya!")
llm_output = llm(promptValue)

# 使用解析器进行解析生成的内容
output_parser.parse(llm_output)

4. 使用 Hugging Face 模型

#使用 Hugging Face 模型之前，需要先设置环境变量
import os
os.environ['HUGGINGFACEHUB_API_TOKEN'] = ''

使用在线的 Hugging Face 模型

from langchain import PromptTemplate, HuggingFaceHub, LLMChain

template = """Question: {question}
Answer: Let's think step by step."""

prompt = PromptTemplate(template=template, input_variables=["question"])
llm = HuggingFaceHub(repo_id="google/flan-t5-xl", model_kwargs={"temperature":0, "max_length":64})
llm_chain = LLMChain(prompt=prompt, llm=llm)

question = "What NFL team won the Super Bowl in the year Justin Beiber was born?"
print(llm_chain.run(question))

将 Hugging Face 模型直接拉到本地使用

from langchain import PromptTemplate, LLMChain
from langchain.llms import HuggingFacePipeline
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline, AutoModelForSeq2SeqLM

model_id = 'google/flan-t5-large'
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForSeq2SeqLM.from_pretrained(model_id)

pipe = pipeline(
    "text2text-generation",
    model=model,
    tokenizer=tokenizer,
    max_length=100
)

local_llm = HuggingFacePipeline(pipeline=pipe)
print(local_llm('What is the capital of France? '))


template = """Question: {question} Answer: Let's think step by step."""
prompt = PromptTemplate(template=template, input_variables=["question"])

llm_chain = LLMChain(prompt=prompt, llm=local_llm)
question = "What is the capital of England?"
print(llm_chain.run(question))

将模型拉到本地使用的好处：
训练模型
可以使用本地的 GPU
有些模型无法在 Hugging Face 运行

4. 通过自然语言执行SQL命令

我们通过 SQLDatabaseToolkit 或者 SQLDatabaseChain 都可以实现执行SQL命令的操作

from langchain.agents import create_sql_agent
from langchain.agents.agent_toolkits import SQLDatabaseToolkit
from langchain.sql_database import SQLDatabase
from langchain.llms.openai import OpenAI

db = SQLDatabase.from_uri("sqlite:///../notebooks/Chinook.db")
toolkit = SQLDatabaseToolkit(db=db)

agent_executor = create_sql_agent(
    llm=OpenAI(temperature=0),
    toolkit=toolkit,
    verbose=True
)

agent_executor.run("Describe the playlisttrack table")
from langchain import OpenAI, SQLDatabase, SQLDatabaseChain

db = SQLDatabase.from_uri("mysql+pymysql://root:root@127.0.0.1/chinook")
llm = OpenAI(temperature=0)

db_chain = SQLDatabaseChain(llm=llm, database=db, verbose=True)
db_chain.run("How many employees are there?")

参考文献：
[1].https://blog.csdn.net/lht0909/article/details/130412875
[2].https://blog.csdn.net/v_JULY_v/article/details/131552592
[3].https://developer.aliyun.com/article/1221923
[4].https://liaokong.gitbook.io/llm-kai-fa-jiao-cheng/#jie-gou-hua-shu-chu

你可能感兴趣的:(langchain,python,chatgpt)

【Python】解决PyTorch报错：PytorchStreamReader failed reading zip archive: failed finding central的解决方案 I'mAlex python pytorch 开发语言
在使用PyTorch时，遇到“PytorchStreamReaderfailedreadingziparchive:failedfindingcentral”错误通常是由于损坏的模型文件或不兼容的文件版本导致的。这种问题在加载模型或数据时比较常见。以下是一些排查和解决该问题的步骤。博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘
Python编写的嵌入式系统测试框架程序员杨弋 Python全栈工程师学习指南嵌入式开发 python 开发语言嵌入式
嵌入式系统是一种专门设计用于控制和执行特定任务的计算机系统，测试嵌入式系统是确保其功能和性能达到预期的重要步骤，为了简化测试过程和提高效率，可以使用Python编写的测试框架，本文将介绍如何使用Python编写一个简单的嵌入式系统测试框架，并提供相应的源代码。测试框架的目标是提供一种结构化的方法来执行测试，并生成有关测试执行结果的报告，在嵌入式系统中测试框架通常涉及与硬件交互、执行测试用例、记录结
码农救星！Python使用助手智能体，让编程效率起飞 WilsonShiiii python django pygame virtualenv flask dash pyqt
各位Python开发者们，还在为代码里的各种难题抓耳挠腮吗？今天必须给大家分享一款神器——我的Python使用助手智能体，它堪称咱们编程路上的得力小助手，有了它，编程效率直线飙升！智能语法纠错，编程路上零障碍：写代码时，语法错误最让人头疼，一个小错误可能要花费大量时间排查。而Python使用助手智能体拥有强大的语法分析能力，当你输入代码后，它能瞬间精准定位语法错误，不仅如此，还会给出详细的修改建议
Python实现简易DLNA投屏功能，局域网秒变家庭影院！代码简单说 2025开发必备 python 开发语言 DLNA投屏无线投屏 python实现dlna投屏
欢迎关注『2025开发必备』专栏，专注于解决你在开发过程中遇到的各种问题，帮你快速找到解决方案，节省大量调试时间。内容持续更新中，保证每篇都值得收藏！Python实现简易DLNA投屏，局域网秒变家庭影院！一、前言前两天，我朋友问我，能不能用Python写一个DLNA投屏工具，能把视频从电脑推送到智能电视上播放。我一听，这不就是DLNA协议的基本应用吗？于是花了点时间，写了一个简易版的DLNA投屏脚
python读取docx文件_Python读写docx文件 weixin_39710106 python读取docx文件
Python读写word文档有现成的库可以处理。我这里采用python-docx。可以用pipinstallpython-docx安装一下。这里说一句，ppt和excel也有类似的库哦，而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理，doc格式不是基于xml的。1、新建或打开文件。这个比较简单用docx的Document类，若指定路径则是打开文档；若没有指定路径则是新建文档#c
关于python有什么问题_关于python中的问题 weixin_39648297 关于python有什么问题
问题1：什么是正确的缩进,缩进是干嘛用的?因为Python中的语句块(如判断、循环等中的语句块)是通过不同的缩进来区分的:不像C或JAVA中的有诸如{}这样的花括号去确定代码块举例:ifuser=='root'{#这里是JAVA或PHP的中if语句块,这里你缩进也许不缩进也行看你自己风格}ifuser=='root'#这里是Python中的,语句块一定要缩进.否则就会提示语法错误.一般用四个空格或
python 读取各类文件格式的文本信息:doc,html,mht,excel 北房有佳人手写功能 python读取doc文档 python读取mht python读取excel python读取html
引言众所周知,python最强大的地方在于，python社区汇总拥有丰富的第三方库，开源的特性，使得有越来越多的技术开发者来完善python的完美性。未来人工智能，大数据方向，区块链的识别和进阶都将以python为中心来展开。咳咳咳！好像有点打广告的嫌疑了。当前互联网信息共享时代，最重要的是什么?是数据。最有价值的是什么？是数据。最能直观体现技术水平的是什么?还是数据。所以，今天我们要分享的是：如
python中常见的生成器内容哈哈哈哈q python python
在Python中，生成器（Generator）是一种特殊的迭代器，可以通过函数中的yield关键字轻松创建。生成器的主要特点有：惰性计算：生成器不会一次性计算出所有的值，而是在需要时逐个生成值。节省内存：因为不会一次性存储所有值，所以在处理大数据时效率很高。访问的形式
机器学习入门-读书摘要不像程序员的程序媛机器学习人工智能
先看了《深度学习入门：基于python的理论和实践》这本电子书，早上因为入迷还坐过站了。。因为里面的反向传播和链式法则特别难懂，又网上搜了相关内容进行进一步理解，参考的以下文章（个人认为都讲的都非常好）：https://zhuanlan.zhihu.com/p/65472471https://zhuanlan.zhihu.com/p/635438713https://zhuanlan.zhihu.
【图像处理】使用Python进行实时人脸检测和识别无水先生 AI原理和python实现深度学习和计算机视觉人工智能综合人工智能
一、说明你有没有想过用Python构建一个面部识别系统？不要再看了！在本教程中，我们将使用face_recognition库来检测和识别视频流、图像甚至使用网络摄像头实时检测和识别人脸。二、基本概念人脸识别和人脸检测是计算机视觉领域的两个独立任务。人脸检测是在照片或视频中自动定位人脸的过程。它通常涉及查找面部关键点的位置，例如嘴角和眼睛，并使用这些点来确定面部的位置、大小和方向。另一方面，人脸识别
清华大学KVCache.AI团队联合趋境科技联合的KTransformers开源项目为什么那么厉害魔王阿卡纳兹 IT杂谈人工智能科技开源清华 DeepSeek 趋境科技 KTransformers
KTransformers是一个由清华大学KVAV.AI团队开发的开源项目，旨在优化大语言模型（LLM）的推理性能，特别是在有限显存资源下运行大型模型。以下是KTransformers的详细介绍：1.核心特点高性能优化：KTransformers通过内核级优化、多GPU并行策略和稀疏注意力等技术，显著加速模型推理速度，降低硬件门槛。灵活扩展性：KTransformers是一个以Python为中心的
500道Python毕业设计题目推荐，附源码 Java老徐 Python 毕业设计 python 课程设计 notepad++Python毕业设计题目毕业设计题目推荐毕业设计题目
博主介绍：✌Java老徐、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟Java基于微信小程序的校园外卖平台设计与实现，附源码Python基于Django的微博热搜、微博舆论可视化系统，附源码Java基于SpringBoot+Vue的学生宿舍管理系统感兴趣
使用Python进行自然语言理解和意图识别毕业设计源码 sj52abcd python 课程设计开发语言毕业设计
博主介绍：✌专注于VUE,小程序，安卓，Java,python,物联网专业，有17年开发经验，长年从事毕业指导，项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题，我会尽力帮助你。研究的背景:随着人工智能的发展，自然语言处理成为了人工智能领域的一个重要分支。在自然语言处理中，理解用户的意图是非常关键的一步。随着Python语言的广泛应用，Python成为了许多自然语言处理任务的
设计模式Python版命令模式（下）小王子1024 设计模式Python版设计模式 python 命令模式
文章目录前言一、命令队列的实现二、撤销操作的实现三、请求日志四、宏命令前言GOF设计模式分三大类：创建型模式：关注对象的创建过程，包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式：关注类和对象之间的组合，包括适配器模式、桥接模式、组合模式、装饰模式、外观模式、享元模式和代理模式。行为型模式：关注对象之间的交互，包括职责链模式、命令模式、解释器模式、迭代器模式
已解决OSError: [Errno 22] Invalid argument 袁袁袁袁满 python
已解决OSError:[Errno22]Invalidargument文章目录报错代码报错翻译报错原因解决方法千人全栈VIP答疑群联系博主帮忙解决报错报错代码粉丝群里面的一个粉丝用Python读取文件的时候，发生了报错（跑来找我求助，然后顺利帮助他解决了，顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴），报错信息和代码如下：f=open(file,'r',encoding='utf-
使用 YOLOv8 模型分析摄像头的图像欣然～ YOLO
在Python中使用YOLOv8模型分析摄像头的图像并进行分类。1.安装依赖库首先，你需要安装ultralytics库，它提供了YOLOv8的PythonAPI。可以使用以下命令进行安装：bashpipinstallultralytics2.编写Python代码以下是一个使用YOLOv8模型对摄像头图像进行分类的示例代码：importcv2fromultralyticsimportYOLO#加载预
(3种解决思路)OSError: [Errno 22] Invalid argument:解决python爬虫中报错万物皆可der 爬虫 python
虽然是个小问题，但是纠结我好长时间，找了就此记录一下。1.路径问题更改为：withopen('./file/hi.txt','r','encoding='utf-8'')或withopen('.//file//hi.txt','r'
华为OD机试2025年E卷-完美走位[100分]（ Java | Python3 | C++ | C语言 | JsNode | Go ）实现100%通过率梅花C 华为OD题库华为od 游戏 java
题目描述在第一人称射击游戏中，玩家通过键盘的A、S、D、W四个按键控制游戏人物分别向左、向后、向右、向前进行移动，从而完成走位。假设玩家每按动一次键盘，游戏任务会向某个方向移动一步，如果玩家在操作一定次数的键盘并且各个方向的步数相同时，此时游戏任务必定会回到原点，则称此次走位为完美走位。现给定玩家的走位（例如：ASDA），请通过更换其中一段连续走位的方式使得原走位能够变成一个完美走位。其中待更换的
学习计划：第三阶段（第六周）狐凄学习学习 python 开发语言
目录第三阶段：继承与多态第6周：掌握多态的实现周一：周二：周三：周四：周五：总结一、学习内容回顾（一）理论知识（二）代码实践二、问题与解决（一）问题（二）解决方法三、学习成果四、下周计划第三阶段：继承与多态第6周：掌握多态的实现周一：理论学习：深入学习多态的概念，理解多态是指不同对象对同一消息（方法调用）做出不同响应的能力。在Python中，基于继承实现多态主要通过子类重写父类方法，然后在运行时根
【Python第三方库】PyQt5安装与应用墨辰JC Python python qt 开发语言学习 pyqt
文章目录引言安装PYQT5基于Pyqt5的简单桌面应用常用的方法与属性QtDesigner工具使用与集成窗口类型QWidget和QMainWindow区别UI文件加载方式直接加载UI文件的方式显示窗口转化py文件进行显示窗口PyQt5中常用的操作信号与槽的设置绑定页面跳转引言PyQt5是一个流行的Python库，用于创建桌面应用程序。它提供了对Qt应用程序框架的访问，使得开发者可以利用Qt的强大功
解决windows下python3.6.5版本的datetime问题:OSError: [Errno 22] Invalid argument 地平线here python python
解决windows下python3.6.5版本的datetime问题1.解决方案在自己代码中使用datetime.datetime.fromtimestamp的位置替换为下面的timestamp_to_datetime函数即可importpytzimportdatetimedeftimestamp_to_datetime(t):"""时间戳转日期时间"""ift>=86400:#24h=86400
OSError: [Errno 22] Invalid argument错误解决方案加油小萌兔 python
在做文件读取写入操作的时候遇见OSError:[Errno22]Invalidargument:'F:\\pythonProject\\Api\\common\\2022-03-11_15:37:23test.txt'的报错，单独的打印出文件路径明明是正确，但使用pythonopen()函数读写文件时就会报该错误错误代码：importosimporttimenow=time.strftime("%
OSError: [Errno 22] Invalid argument: 小田月朔一 Python数据分析与可视化 python 数据分析
1.错误原因：文件格式错误OSError:[Errno22]Invalidargument:'F:\\专业课程作业\\python时空数据分析与可视化\tips.xls'2.解决办法：将“\”改为“/”或者将“\”改为“\\”fdata=pd.read_excel("F:\\专业课程作业\\python时空数据分析与可视化\\tips.xls")fdata=pd.read_excel("F:/专业
Python爬虫+数据分析：采集二手房源数据并做可视化嘘！摸鱼中~ 爬虫小案例数据分析小案例 python 数据分析开发语言学习
目录软件使用：模块使用:代码展示尾语今天我们来分享一个用Python采集二手房源数据信息并做可视化得源码软件使用：python3.8开源免费的(统一3.8)jupyter-->pipinstalljupyternotebookPycharmYYDSpython最好用的编辑器不接受反驳…（也可以使用）模块使用:第三方：requests>>>数据请求模块parsel>>>数据解析模块内置：csv内置模
一文讲清Python打包工具PyInstaller 算法channel python 开发语言
你好，我是郭震PyInstaller是一个非常受欢迎和强大的工具，它可以将Python程序转换成独立的可执行文件，适用于Windows、Linux和macOS系统。相比于其他的Python打包工具，PyInstaller综合打包能力应该是最好的。使用PyInstaller可以非常方便地将Python脚本及其所有依赖项打包成一个标准的可执行文件，这对于程序的分发和部署非常有帮助。安装PyInstal
python 入门书籍-推荐几本对于Python初学者比较好的书籍（内含PDF） weixin_37988176
我们提供一个初学者最好的Python书籍列表。Python是一个初级程序员可以学习编程的最友好语言之一。为了帮助您开始使用Python编程，我们分享此列表。泡一杯茶，选一本书阅读，开始使用Python编程！Python编程：从入门到实践本书是一本针对所有层次的Python读者而作的Python入门书。全书分两部分：第一部分介绍用Python编程所必须了解的基本概念；第二部分将理论付诸实践，讲解如何
python做智能机器人客服_Python1707A学员感想：我还想做个人工智能客服机器人 DuckMan电板鸭 python做智能机器人客服
原标题：Python1707A学员感想：我还想做个人工智能客服机器人通过这次做项目，使我对编程有了进一步的认识。做项目的时候，最重要的不是自己如何快速地将自己分配的任务做完，而是要注重团队合作。一开始组内必须对这个项目的数据库的命名进行讨论，定义表的属性的数据类型，表与表之间会有关联，所以有的属性的类型与长度必须定义一致，这样访问数据库时才不会出错。如果一开始不将这些步骤统一下来的话，就会给后面的
188、探索Django中间件：请求与响应的拦截与处理的艺术多多的编程笔记 django 中间件 python
Python开发框架Django之中间件：处理请求与响应的拦截与处理引言想象一下，你正在一家餐厅享用美食。当你点的菜品端上桌时，你希望它既美味又符合你的口味。在软件开发中，尤其是在Web应用开发中，我们需要确保接收到的请求既有效又符合我们的业务规则。这就是Django中间件的作用——作为请求和响应的处理过程中的一个环节，它允许我们在请求到达视图之前对其进行修改，或在响应发送给客户端之前进行修改。本
pyinstaller如何下载以及问题解决如鸿毛 python
pyinstaller如何下载以及问题解决。①windows+R,输入cmd在控制面版输入pipinstallpyinstaller就可以下载。②成功会出现Successfullyinstalledpyinstaller-x.x.x.,同时在你的python的安装目录scripts。③在控制面板进入你编写程序的文件目录。④成功后，进入，生成的dist文件夹，按图片步骤输入回车，就可运行.exe文件
numpy.float8不存在；Python中，实现16位浮点数 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力算法 python 数据结构人工智能
目录python中矩阵的浮点数存储numpy.float8不存在Python中，实现16位浮点数实现float16关于float8python中矩阵的浮点数存储在Python中，矩阵通常是通过嵌套列表（listoflists）、NumPy数组（numpy.ndarray）或其他类似的数据结构来表示的。矩阵中存储的数值所占用的位数取决于多个因素，包括数值的类型（整数、浮点数等）以及具体的数值范围。嵌
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: 361942420@qq.com
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情