同学小张

【AI大模型应用开发】3. RAG初探 - 动手实现一个最简单的RAG应用

大家好，我是【同学小张】。持续学习，持续干货输出，关注我，跟我一起学AI大模型技能。

文章目录

- 0. 什么是RAG
- 1. RAG基本流程
- 2. 向量数据库的生成
- - 2.1 文档加载与分块
  - 2.2 创建向量数据库
  - - 2.2.1 创建过程
    - 2.2.2 运行结果
    - 2.2.3 踩坑
    - - 2.2.3.1 坑一：NoneType object is not iterable
      - 2.2.3.2 坑二：Number of embeddings 9 must match number of ids 10
- 3. Prompt模板
- 4. 使用大模型得到答案
- - 4.1 封装OpenAI接口
  - 4.2 组装Prompt
  - 4.3 使用大模型得到答案
- 5. 总结
- - 5.1 封装RAG
  - 5.2 完整代码
- 6. 思考

0. 什么是RAG

大模型也不是万能的，也有局限性。

LLM 的知识不是实时的
LLM 可能不知道你私有的领域/业务知识

RAG（Retrieval Augmented Generation）顾名思义：通过检索的方法来增强生成模型的能力。你可以把这个过程想象成开卷考试。让 LLM 先翻书，再回答问题。

1. RAG基本流程

看图就很容易理解RAG的流程了：
（1）私有知识通过切分、向量化保存到向量数据库中，供后续使用
（2）用户提问时，将用户提问用同样的方式向量化，然后去向量数据库中检索
（3）检索出相似度最高的k个切分段落
（4）将检索结果和用户的提问放到Prompt模板中，组装成一个完整的Prompt
（5）组装好的Prompt给大模型，让大模型生成回答

理想状态下，大模型是完全依赖检索出的文档片段进行组织答案的

简化一下，可以看出RAG有两大过程：

加载文档，生成向量数据库
查询向量数据库，询问大模型得到答案

下面我们一步步拆解，深入了解下RAG的流程和实现RAG所需的基本模块。

2. 向量数据库的生成

2.1 文档加载与分块

首先加载我们私有的知识库。这里以加载PDF文件为例。Python提供了加载PDF的一些库，这里用 pdfminer。

安装 pdfminer：

pip install pdfminer.six

先看代码：

from pdfminer.high_level import extract_pages
from pdfminer.layout import LTTextContainer

class PDFFileLoader():
    def __init__(self, file) -> None:
        self.paragraphs = self.extract_text_from_pdf(file, page_numbers=[0,3])
        i = 1
        for para in self.paragraphs[:3]:
            print(f"========= 第{i}段 ==========")
            print(para+"\n")
            i += 1
    
    def getParagraphs(self):
        return self.paragraphs

    ################################# 文档的加载与切割 ############################
    def extract_text_from_pdf(self, filename, page_numbers=None):
        '''从 PDF 文件中（按指定页码）提取文字'''
        paragraphs = []
        buffer = ''
        full_text = ''
        # 提取全部文本
        for i, page_layout in enumerate(extract_pages(filename)):
            # 如果指定了页码范围，跳过范围外的页
            if page_numbers is not None and i not in page_numbers:
                continue
            for element in page_layout:
                if isinstance(element, LTTextContainer):
                    full_text += element.get_text() + '\n'
        
        # 段落分割
        lines = full_text.split('。\n')
        for text in lines:
            buffer = text.replace('\n', ' ')
            
            if buffer:
                paragraphs.append(buffer)
                buffer = ''
                row_count = 0
                
        if buffer:
            paragraphs.append(buffer)
        return paragraphs

PDFFileLoader("D:\GitHub\LEARN_LLM\RAG\如何向 ChatGPT 提问以获得高质量答案：提示技巧工程完全指南.pdf")

代码解释

（1）我们首先定义了一个 PDFFileLoader 的类，接收一个PDF文件路径。然后类内部调用extract_text_from_pdf去解析PDF文件并分段。
（2）extract_text_from_pdf中前半部分代码是利用 extract_pages 按页提取出PDF文件中的文字，然后组装成 full_text 。
（3）extract_text_from_pdf中后半部分代码是将 full_text 进行段落划分。

说明：因为每个PDF提取出来的文字格式可能不同，有的每一行后面都带有"\n\n"，有的不带有"\n\n"，有的每一行中的单词都粘在一起…，各种各样，所以PDF文字划分和段落分割的算法都无法做到完美适应所有PDF。本文重点不再这，所以粗暴地根据"。\n"划分了段落。实际应用中这里你应该按照你的PDF文件去进行调试和分割，段落划分这几行代码不能直接用。

可以简单看下我为什么能如此粗暴的划分段落：通过extract_pages提取出来的文本如下：

'如何向 ChatGPT 提问以获得高质量答案：提示\n技巧工程完全指南\n\n介绍\n\n我很高兴欢迎您阅读我的最新书籍《The Art
of Asking ChatGPT for High-Quality Answers: A complete \n\nGuide to
Prompt Engineering
Techniques》。本书是一本全面指南，介绍了各种提示技术，用于从\n\nChatGPT中生成高质量的答案。\n\n我们将探讨如何使用不同的提示工程技术来实现不同的目标。ChatGPT是一款最先进的语言模型，能够生成\n\n类似人类的文本。然而，理解如何正确地向ChatGPT提问以获得我们所需的高质量输出非常重要。而这正是\n本书的目的。\n\n无论您是普通人、研究人员、开发人员，还是只是想在自己的领域中将ChatGPT作为个人助手的人，本书都\n是为您编写的。我使用简单易懂的语言，提供实用的解释，并在每个提示技术中提供了示例和提示公式。通\n\n过本书，您将学习如何使用提示工程技术来控制ChatGPT的输出，并生成符合您特定需求的文本。\n\n在整本书中，我们还提供了如何结合不同的提示技术以实现更具体结果的示例。我希望您能像我写作时一\n\n样，享受阅读本书并从中获得知识。\n\n
\n\n

与原文对比，大体上按"。\n"来分割能与实际段落比较接近，所以本例我就先这样干了。这实际是不能用于实际项目的：

分割结果（打印前三段）：

2.2 创建向量数据库

本文以 chromadb 向量数据库为例进行实操。

安装向量数据库chromadb

pip install chromadb

2.2.1 创建过程

（1）创建一个向量数据库类。该类add_documents函数用来添加数据，它需要三个参数：

文档的向量
文档的原文
文档的id

import chromadb
from chromadb.config import Settings

class MyVectorDBConnector:
    def __init__(self, collection_name, embedding_fn):
        chroma_client = chromadb.Client(Settings(allow_reset=True))

        # 为了演示，实际不需要每次 reset()
        chroma_client.reset()

        # 创建一个 collection
        self.collection = chroma_client.get_or_create_collection(name=collection_name)
        self.embedding_fn = embedding_fn

    def add_documents(self, documents):
        '''向 collection 中添加文档与向量'''
        self.collection.add(
            embeddings=self.embedding_fn(documents),  # 每个文档的向量
            documents=documents,  # 文档的原文
            ids=[f"id{i}" for i in range(len(documents))]  # 每个文档的 id
        )

    def search(self, query, top_n):
        '''检索向量数据库'''
        results = self.collection.query(
            query_embeddings=self.embedding_fn([query]),
            n_results=top_n
        )
        return results

（2）文档的向量怎么来？可以通过OpenAI的embeddings接口计算得到：

from openai import OpenAI
import os
# 加载环境变量
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())  # 读取本地 .env 文件，里面定义了 OPENAI_API_KEY

client = OpenAI()

def get_embeddings(texts, model="text-embedding-3-small"):
    '''封装 OpenAI 的 Embedding 模型接口'''
    print(texts)
    print(model)
    data = client.embeddings.create(input=texts, model=model).data
    print(data)
    return [x.embedding for x in data]

（3）调用接口，创建向量数据库

# 创建一个向量数据库对象
vector_db = MyVectorDBConnector("demo", get_embeddings)
# 向向量数据库中添加文档
vector_db.add_documents(pdf_loader.getParagraphs())

（4）测试查询

user_query = "什么是角色提示？"
results = vector_db.search(user_query, 3) # 3是指查询出最相近的3块文本
for para in results['documents'][0]:
    print(para+"\n\n")

2.2.2 运行结果

（1）通过OpenAI的embeddings接口计算得到的文本向量

（2）查询结果，查找出最相近的3块文本

2.2.3 踩坑

2.2.3.1 坑一：NoneType object is not iterable

原因：传入的分块有空字符的情况。

不知道这种情况为什么会导致NoneType的错误，可能是OpenAI向量化时对特殊字符进行了去除？

解决方法：保证分块中没有全是特殊字符的分块即可。

2.2.3.2 坑二：Number of embeddings 9 must match number of ids 10

原因：可以看下下面的代码，上面的错误指的是embeddings是9个值，而ids有10个值。这是因为在解决坑一时，将里面最后那个空的文档分块去掉了，没去生成embeddings。

self.collection.add(
    embeddings=self.embedding_fn(documents),  # 每个文档的向量
    documents=documents,  # 文档的原文
    ids=[f"id{i}" for i in range(len(documents))]  # 每个文档的 id
)

解决方法：保证documents和embeddings的数组大小长度一致。

以上两个坑总体的解决方案代码，看下里面修改的部分（注释部分），在段落分割部分就把异常的分块去掉，从源头上保证documents的正常以及后面documents和embeddings数组大小一致：

# 段落分割
lines = full_text.split('。\n')
for text in lines:
    buffer = text.strip(' ').replace('\n', ' ').replace('[', '').replace(']', '') ## 1. 去掉特殊字符
    if len(buffer) < 10: ## 2. 过滤掉长度小于 10 的段落，这可能会导致一些信息丢失，慎重使用，实际生产中不能用
        continue
    if buffer:
        paragraphs.append(buffer)
        buffer = ''
        row_count = 0
        
if buffer and len(buffer) > 10: ## 3. 过滤掉长度小于 10 的段落，这可能会导致一些信息丢失，慎重使用，实际生产中不能用
    paragraphs.append(buffer)
return paragraphs

注意：文档分块不一定是按段落分。

3. Prompt模板

上面我们已经拿到了检索回来的相关文档。下面我们写一个Prompt模板用来组装这些文档以及用户的提问。

def build_prompt(prompt_template, **kwargs):
    '''将 Prompt 模板赋值'''
    prompt = prompt_template
    for k, v in kwargs.items(): 
        if isinstance(v,str):
            val = v
        elif isinstance(v, list) and all(isinstance(elem, str) for elem in v):
            val = '\n'.join(v)
        else:
            val = str(v)
        prompt = prompt.replace(f"__{k.upper()}__",val)
    return prompt

prompt_template = """
你是一个问答机器人。
你的任务是根据下述给定的已知信息回答用户问题。
确保你的回复完全依据下述已知信息。不要编造答案。
如果下述已知信息不足以回答用户的问题，请直接回复"我无法回答您的问题"。

已知信息:
__INFO__

用户问：
__QUERY__

请用中文回答用户问题。
"""

注意以上最重要的提示词，要求大模型完全按照给定的文本回答问题：

你的任务是根据下述给定的已知信息回答用户问题。
确保你的回复完全依据下述已知信息。不要编造答案。
如果下述已知信息不足以回答用户的问题，请直接回复"我无法回答您的问题"。

4. 使用大模型得到答案

4.1 封装OpenAI接口

def get_completion(prompt, model="gpt-3.5-turbo-1106"):
    '''封装 openai 接口'''
    messages = [{"role": "user", "content": prompt}]
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=0,  # 模型输出的随机性，0 表示随机性最小
    )
    return response.choices[0].message.content

4.2 组装Prompt

prompt = build_prompt(prompt_template, info=results['documents'][0], query=user_query)
print(prompt)

运行结果

4.3 使用大模型得到答案

response = get_completion(prompt)
print(response)

运行结果

5. 总结

至此，我们已经实现了RAG的基本流程。总结下流程：

离线部分，可提前生成好
（1）文档加载与分块
（2）分块数据灌入向量数据库
在线部分
（3）解析用户提问，用户提问向量化
（4）查询向量数据库，得到最相似的k个文本块
（5）使用得到的k个文本块和用户提问组装Prompt模板
（6）询问大模型得到最终答案

5.1 封装RAG

我们将RAG流程封装一下，createVectorDB完成离线部分，创建出向量数据库和灌入数据。chat完成在线部分。

class RAG_Bot:
    def __init__(self, n_results=2):
        self.llm_api = get_completion
        self.n_results = n_results

    def createVectorDB(self, file):
        print(file)
        pdf_loader = PDFFileLoader(file)
        # 创建一个向量数据库对象
        self.vector_db = MyVectorDBConnector("demo", get_embeddings)
        # 向向量数据库中添加文档，灌入数据
        self.vector_db.add_documents(pdf_loader.getParagraphs())

    def chat(self, user_query):
        # 1. 检索
        search_results = self.vector_db.search(user_query,self.n_results)
        
        # 2. 构建 Prompt
        prompt = build_prompt(prompt_template, info=search_results['documents'][0], query=user_query)
        
        # 3. 调用 LLM
        response = self.llm_api(prompt)
        return response

使用

rag_bot = RAG_Bot()
rag_bot.createVectorDB("D:\GitHub\LEARN_LLM\RAG\如何向 ChatGPT 提问以获得高质量答案：提示技巧工程完全指南.pdf")
response = rag_bot.chat("什么是角色提示？")
print("response=====================>")
print(response)

5.2 完整代码

from pdfminer.high_level import extract_pages
from pdfminer.layout import LTTextContainer


class PDFFileLoader():
    def __init__(self, file) -> None:
        self.paragraphs = self.extract_text_from_pdf(file, page_numbers=[0,3])
        i = 1
        for para in self.paragraphs:
            print(f"========= 第{i}段 ==========")
            print(para+"\n")
            i += 1
    
    def getParagraphs(self):
        return self.paragraphs

    ################################# 文档的加载与切割 ############################
    def extract_text_from_pdf(self, filename, page_numbers=None):
        '''从 PDF 文件中（按指定页码）提取文字'''
        paragraphs = []
        buffer = ''
        full_text = ''
        # 提取全部文本
        for i, page_layout in enumerate(extract_pages(filename)):
            # 如果指定了页码范围，跳过范围外的页
            if page_numbers is not None and i not in page_numbers:
                continue
            for element in page_layout:
                if isinstance(element, LTTextContainer):
                    full_text += element.get_text() + '\n'
        
        # 段落分割
        lines = full_text.split('。\n')
        for text in lines:
            buffer = text.strip(' ').replace('\n', ' ').replace('[', '').replace(']', '') ## 1. 去掉特殊字符
            if len(buffer) < 10: ## 2. 过滤掉长度小于 10 的段落，这可能会导致一些信息丢失，慎重使用，实际生产中不能用
                continue
            if buffer:
                paragraphs.append(buffer)
                buffer = ''
                row_count = 0
                
        if buffer and len(buffer) > 10: ## 3. 过滤掉长度小于 10 的段落，这可能会导致一些信息丢失，慎重使用，实际生产中不能用
            paragraphs.append(buffer)
        return paragraphs

# pdf_loader = PDFFileLoader("D:\GitHub\LEARN_LLM\RAG\如何向 ChatGPT 提问以获得高质量答案：提示技巧工程完全指南.pdf")

from openai import OpenAI
import os
# 加载环境变量
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())  # 读取本地 .env 文件，里面定义了 OPENAI_API_KEY

client = OpenAI()

def get_embeddings(texts, model="text-embedding-3-small"):
    '''封装 OpenAI 的 Embedding 模型接口'''
    data = client.embeddings.create(input=texts, model=model).data
    return [x.embedding for x in data]

import chromadb
from chromadb.config import Settings

class MyVectorDBConnector:
    def __init__(self, collection_name, embedding_fn):
        chroma_client = chromadb.Client(Settings(allow_reset=True))

        # 为了演示，实际不需要每次 reset()
        chroma_client.reset()

        # 创建一个 collection
        self.collection = chroma_client.get_or_create_collection(name=collection_name)
        self.embedding_fn = embedding_fn

    def add_documents(self, documents):
        '''向 collection 中添加文档与向量'''
        self.collection.add(
            embeddings=self.embedding_fn(documents),  # 每个文档的向量
            documents=documents,  # 文档的原文
            ids=[f"id{i}" for i in range(len(documents))]  # 每个文档的 id
        )

    def search(self, query, top_n):
        '''检索向量数据库'''
        results = self.collection.query(
            query_embeddings=self.embedding_fn([query]),
            n_results=top_n
        )
        return results

# # 创建一个向量数据库对象
# vector_db = MyVectorDBConnector("demo", get_embeddings)
# # 向向量数据库中添加文档
# vector_db.add_documents(pdf_loader.getParagraphs())

# user_query = "什么是角色提示？"
# results = vector_db.search(user_query, 3)
# for para in results['documents'][0]:
#     print(para+"\n\n")

def build_prompt(prompt_template, **kwargs):
    '''将 Prompt 模板赋值'''
    prompt = prompt_template
    for k, v in kwargs.items(): 
        if isinstance(v,str):
            val = v
        elif isinstance(v, list) and all(isinstance(elem, str) for elem in v):
            val = '\n'.join(v)
        else:
            val = str(v)
        prompt = prompt.replace(f"__{k.upper()}__",val)
    return prompt

prompt_template = """
你是一个问答机器人。
你的任务是根据下述给定的已知信息回答用户问题。
确保你的回复完全依据下述已知信息。不要编造答案。
如果下述已知信息不足以回答用户的问题，请直接回复"我无法回答您的问题"。

已知信息:
__INFO__

用户问：
__QUERY__

请用中文回答用户问题。
"""

########################### 大模型接口封装 #############################

def get_completion(prompt, model="gpt-3.5-turbo-1106"):
    '''封装 openai 接口'''
    messages = [{"role": "user", "content": prompt}]
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=0,  # 模型输出的随机性，0 表示随机性最小
    )
    return response.choices[0].message.content

# prompt = build_prompt(prompt_template, info=results['documents'][0], query=user_query)
# print(prompt)

# response = get_completion(prompt)
# print(response)


##################################  基于向量检索的 RAG ##################
class RAG_Bot:
    def __init__(self, n_results=2):
        self.llm_api = get_completion
        self.n_results = n_results

    def createVectorDB(self, file):
        print(file)
        pdf_loader = PDFFileLoader(file)
        # 创建一个向量数据库对象
        self.vector_db = MyVectorDBConnector("demo", get_embeddings)
        # 向向量数据库中添加文档，灌入数据
        self.vector_db.add_documents(pdf_loader.getParagraphs())

    def chat(self, user_query):
        # 1. 检索
        search_results = self.vector_db.search(user_query,self.n_results)
        
        # 2. 构建 Prompt
        prompt = build_prompt(prompt_template, info=search_results['documents'][0], query=user_query)
        print("prompt===================>")
        print(prompt)
        
        # 3. 调用 LLM
        response = self.llm_api(prompt)
        return response


rag_bot = RAG_Bot()
rag_bot.createVectorDB("D:\GitHub\LEARN_LLM\RAG\如何向 ChatGPT 提问以获得高质量答案：提示技巧工程完全指南.pdf")
response = rag_bot.chat("什么是角色提示？")
print("response=====================>")
print(response)

6. 思考

RAG 是一个增强大模型垂直领域能力和减少幻觉的通用方法论，所以了解其原理和流程对实现出效果较好的大模型应用非常有用。

但是上面也可以看到，它也限制了大模型使用其自身的知识库去回答问题，只能够用给定的文本回复问题。这就导致这个RAG应用的通用性大大降低。

另外，从RAG流程中也可以看到要想实现的效果好，也是困难重重：
（1）预处理： 首先文本分割的块要恰到好处

文本分割的粒度太小，查找到的参考文本较少
文本颗粒度太大，参考文本太多，消耗token，同时也会带入更多的干扰信息，导致大模型出现幻觉的概率增加

（2）有些问题的回答是需要依赖上下文的，怎样将上下文所在的文本块都找出来也不容易

（3）召回正确性：召回文档的相关性也对结果比较重要。查找出的文档虽然与用户提问的向量值比较相似，但某些时候，最相似的并不一定是与问题答案相关的

（4）大模型本身的能力对结果也比较重要

目前针对以上各个困难都有非常多的研究，还在快速发展阶段，未形成一套通用、效果好的方法论。

后面可以针对这部分进行深入探索和学习，关注和整理当下最新的RAG调优方法。敬请期待。

如果觉得本文对你有帮助，麻烦点个赞和关注呗 ~~~

大家好，我是同学小张

欢迎 点赞 + 关注 ，促使我持续学习，持续干货输出。

+v: jasper_8017 一起交流，一起进步。

微信公众号也可搜【同学小张】

踩坑不易，感谢关注和围观

本站文章一览：

Manus学习手册合集【建议收藏】周师姐学习 pdf 人工智能
这两天，一款通用AI智能体Manus还没发布就火了，因为还在内测中，用户需要邀请码才能够体验，这就导致原本免费的邀请码在二手平台最高被炒到8万8。相比于之前爆火的DeepSeek和ChatGPT这类AI对话工具，Manus是全球首款真正意义上的通用人工智能！没错，就是科幻电影里面能够独立思考，自主运行的人工智能！！manus学习资料：https://pan.xunlei.com/s/VOKk8Cq
YashanDB更换服务器IP 数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E5%AE%89%E8%A3%85%...本文主要介绍当一个单机部署的数据库集群中，一台或多台服务器的IP发生变更时，管理员如何通过yasbootipchange命令进行数据库层面的IP更换操作，最终使得数据库恢复可用。下述操作将以一主两备环境中的两台服务器IP发生变
YashanDB离线升级数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E5%AE%89%E8%A3%85%...YashanDB支持通过yasboot工具离线升级已部署的数据库，将数据库二进制文件升级到新版本。Note:本文中所有路径、版本号、用户、密码与回显信息等仅为示例，请以实际为准。注意事项离线升级要求当前数据库无新业务数据产生，
云数据库是什么数据库？云服务器数据库
云数据库，简单来说，是一种部署在云计算环境中的数据库服务。它借助云计算的强大资源，将数据库管理系统以服务的形式提供给用户，用户无需在本地自行搭建复杂的硬件和软件环境，通过互联网就能便捷地使用数据库功能。这就像是把原本需要在自家搭建、维护的“数据仓库”搬到了云端的“大型仓储中心”，由专业团队负责管理和维护。与传统数据库相比，云数据库有着诸多明显差异。传统数据库往往需要用户自行购置服务器、存储设备等硬
YashanDB滚动升级回退数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E5%AE%89%E8%A3%85%...数据库升级过程中可能因为网络故障、命令错误、配置文件错误及版本错误等原因导致数据库升级失败，此时请运行升级回退恢复升级前环境。Warn：仅升级失败才允许回退。升级回退的过程中会重启备库。若升级失败且回退仍失败，请联系Yasha
10个热门AI API（2024年2月）程序员后端
人工智能（AI）在当今数字时代发挥着重要的作用，为企业带来了全新的机遇和变革。AI不再是一种陌生的科技概念，而是已经渗透到各行各业，成为推动创新和提升效率的关键引擎。其核心优势在于能够处理大规模的数据、执行复杂的任务、模拟人类思维过程，并以前所未有的方式改善业务流程。AIAPI作为连接企业和强大AI技术的桥梁，扮演着至关重要的角色。通过使用AIAPI，企业能够快速、轻松地将先进的人工智能功能集成到
三步部署阿里通义万相视频生成大模型【万相开源、喜大普奔】坐望峰机器学习语言模型计算机视觉
阿里巴巴于2025年2月25日晚宣布全面开源其视频生成大模型通义万相2.1（Wan），这一举措标志着中国AI开源生态的又一重大突破。通义万相的开源不仅加速了AI技术在视频创作、文化传播等领域的落地，也引发了关于AI生成内容伦理与质量的讨论。随着技术迭代，其应用可能扩展至实时内容生成、个性化创作等方向，进一步推动人机协作的边界。开发者可通过GitHub、HuggingFace、魔搭社区下载模型，体验
2025年AI编程的进展与突破调皮的芋头低代码神经网络人工智能 AIGC AI编程
2025年AI编程的进展与突破1.AI编程能力达到中级工程师水平核心技术突破：大语言模型（如GPT-4、Claude3.5）通过海量代码训练，已能理解自然语言需求并生成符合规范的代码，支持复杂任务（如多文件修改、测试生成、代码部署）。能力边界扩展：AI可独立完成模块化开发、代码调试及简单架构设计，例如Meta计划在2025年将中级工程师的工作自动化，部分企业代码生成率已超50%（如科大讯飞）。多模
KubeBlocks 喝醉酒的小白 K8s 学习
KubeBlocks笔记概述KubeBlocks是一个开源的Kubernetes数据库Operator，旨在帮助用户在Kubernetes上运行和管理多种类型的数据库。它提供了通用的API和命令行工具kbcli，支持MySQL、PostgreSQL、MongoDB、Redis、Kafka等多种数据库引擎。主要特点高可用性：集成成熟的高可用解决方案，如Orchestrator、Patroni和Sen
【python】协程（coroutine） atwdy Python python coroutine 协程 asyncio
协程（coroutine）可以理解为一个可以中途暂停保存当前执行状态信息并可以从此处恢复执行的函数，多个协程共用一个线程执行，适合执行需要“等待”的任务。所以严格意义上，多个协程同一时刻也只有一个在真正的执行，因为线程是任务调度的基本单位。注意这里的执行指的是占用CPU计算，不包括等待阻塞等场景。python中实现协程的标准库是asyncio，标准库的实现中大致可以由底层到顶层分为下面几个对象：c
基于阿里云调用deepseek大模型 atwdy 大模型 deepseek deepseek-r1 deepseek API 阿里云
文章目录1.单轮对话2.多轮对话参考文档选择需要调用的模型，每个模型的详细信息中会有API示例（deepseek-r1），需要做的就是申请自己的APIkey就行了，过程中可能需要实名认证。python中安装OpenAISDK：pipinstallopenai。安装后如果出现ImportError，可能是python的版本低了，升级下版本。当前测试环境是Python3.9.7，openai==1.6
学习prompt artificiali prompt
1解释概念中文指令：请借助费曼学习法，以简单的语言解释[特定概念]是什么，并提供一个例子来说明它如何应用。Prompt:PleaseusetheFeynmanLearningTechniquetoexplain[specificconcept]insimplelanguage,andprovideanexampletoillustratehowitapplies.2帕累托法则帮你找到最重要、最具挑
百变背景：万相实验室AIGC电商图片可控生成技术阿里妈妈技术 AIGC 人工智能
✍本文作者：云芑、因尘、岁星、也鹿1.背景随着AI生成内容（AIGC）技术如Diffusion的飞速进展，现如今，大家已能够轻易地使用StableDiffusion（SD）[1]等文生图的模型或工具，将心中所想仅凭语言描述（prompt）即转化为具体图像。基于此，我们不禁思考：是否有可能进一步发展该技术，允许用户通过描述来为商品定制特定背景，从而协助商家快速且轻松地打造理想的商品图像？例如，为一个
人工智能学习大纲互联网搬砖老肖 AI 原力计划工具使用人工智能学习
前言人工智能正以惊人的速度发展，其潜力既令人兴奋，也引人深思。它既可能为解决全球性问题带来希望，也可能带来前所未有的挑战。人工智能时代的到来已是不可逆转的趋势，科幻电影中的某些场景或许将成为现实。我对人工智能的研究越深入，就越能感受到它的强大力量。我所担忧的不仅仅是它对就业市场的冲击，更是它可能对人类社会结构带来的深远影响。未来，对人工智能的理解可能像今天对电脑操作的掌握一样重要。掌握人工智能技术
01计算机视觉学习计划依旧阳光的老码农计算机视觉计算机视觉人工智能
计算机视觉系统学习计划（3-6个月）本计划按照数学→编程→图像处理→机器学习→深度学习→3D视觉→项目实战的顺序，确保从基础到高级，结合理论和实践。第一阶段（第1-2个月）：基础夯实✅目标：掌握数学基础、Python/C++编程、基本图像处理1️⃣数学基础（2周）每日2小时线性代数：矩阵运算、特征值分解（推荐《线性代数及其应用》）概率统计：高斯分布、贝叶斯定理微积分：偏导数、梯度下降傅里叶变换：图
python-Scrapy爬虫框架介绍（整个数据的流程） onesalatree Scrapy框架爬虫 python 软件框架爬虫 scrapy
python-Scrapy爬虫框架介绍随着在家的线上教育的进行，课程的深入学习，所要学习的内容和作业也在不断的增多，所以没有过多的自己的时间去学习新的爬虫知识，但疫情逐渐的在好转，我也很是期待开学的那一天，毕竟线上教育的效果没有在学校的更为显著，主要是老师们录课很辛苦今天我想和兄弟们分享一下Scrapy爬虫的原理，也是自己最近刚学习的，有什么不足的地方兄弟们可以评论你或者私信喔。Python爬虫的
JDBC（超详细）肉肉的小白数据库 java mysql
1简介JDBC（JavaDataBaseConnectivity,java数据库连接）是一种用于执行SQL语句的JavaAPI，可以为多种关系数据库提供统一访问，它由一组用Java语言编写的类和接口组成。JDBC提供了一种基准，据此可以构建更高级的工具和接口，使数据库开发人员能够编写数据库应用程序Java具有坚固、安全、易于使用、易于理解和可从网络上自动下载等特性，是编写数据库应用程序的杰出语言。
TORGO 数据库：构音障碍语音研究的宝贵资源帅小柏语音识别与Wenet实战语音识别与ESPnet实战语音识别
TORGO数据库：构音障碍语音研究的宝贵资源在语音识别和语音病理学领域，构音障碍（Dysarthria）是一个重要的研究方向。构音障碍是由神经运动接口异常引起的，导致发音器官运动异常，语音不清晰，传统自动语音识别（ASR）系统难以有效识别。为了推动这一领域的研究，多伦多大学开发了TORGO数据库，这是一个包含构音障碍患者和正常对照组语音数据的宝贵资源。1.数据库简介TORGO数据库是由多伦多大学计
驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！极小狐 AI编程驭码CodeRider DevSecOps gitlab 极狐GitLab
今日凌晨，国产大模型领域迎来重大突破：阿里正式发布32B推理模型QwQ-32B，根据Qwen公布的基准测试数据，QwQ-32B整体性能可媲美DeepSeek-R1，在数学推理、编程能力和通用能力等关键测试中展现出卓越性能。作为AI编程领域的创新力量，驭码CodeRider始终秉承SOTA（State-of-the-Art，指在特定任务或领域中目前性能最先进的模型）模型策略，不断动态测试与更新适配最
阿里云CTO：通义稳居全球最强开源大模型，性能接近GPT-4o 首席数智官人工智能阿里云云计算
来源：@首席数智官9月19日，在2024杭州云栖大会上，阿里云CTO周靖人表示，阿里云正在围绕AI时代，树立一个AI基础设施的新标准，全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布。基础模型升级，性能媲美GPT-4o，发布最强开源模型Qwen2.5系列，
Conda操作使用教程迷鹿鹿鹿鹿鹿 conda
声明：该文章仅为学习使用，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！如有侵权，请私信联系本人删帖！Conda操作使用教程Conda是一个开源的包管理和环境管理工具，支持多种编程语言（以Python为主）。它能够帮助用户快速安装、运行和更新软件包，并创建相互隔离的虚拟环境，避免项目之间的依赖冲突。目录Conda的安装基础命令虚拟环境管理包管理环境导出与共享常见问题总结一、安装1
数据的封装和解封装数据链路摸索者网络安全网络网络协议 tcp/ip
一、什么是封装封装(encapsulate/encapsulation)：发送方数据要通过网络进行传输，从高向下逐层传送，如果一个主机要传送数据到别的主机，需要加上每层的报头控制信息，这个过程叫封装。封装分为：切片和加控制信息(加上每层的报头)注意：只有封装完成的数据才可以发送出去！！二、什么是解封装解封装：针对接收方，进行数据报头的剥离，上述的逆向过程三、发送方的数据封装TCP/IP对等模型发送
特斯拉FSD不同版本的进化 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
特斯拉，FSD，自动驾驶，深度学习，计算机视觉，强化学习，神经网络，模型训练1.背景介绍特斯拉自2016年推出Autopilot以来，一直致力于开发全自动驾驶系统，其目标是实现完全无人驾驶，让汽车能够像人类一样感知周围环境，做出安全可靠的驾驶决策。FSD（FullSelf-Driving）是特斯拉自动驾驶系统的最高级别，它旨在实现车辆在任何道路和环境条件下都能安全自主驾驶的能力。FSD的开发是一个
Manus AI：全球首款通用型 AI Agent 的创新与挑战萧鼎 python基础到进阶教程人工智能
1.引言：AIAgent时代的到来人工智能正在从单纯的对话式助手进化为更高级的智能体（Agent），能够自主完成任务，而不仅仅是提供信息或建议。2025年3月6日，由中国团队Monica推出的ManusAI正式亮相，号称全球首款通用型AIAgent（自主智能体）。与传统的AI助手相比，Manus不仅能够理解用户的自然语言指令，还能拆解任务、自动执行，并交付完整的成果。这标志着AI进入了一个新的发展
使用 Dlib 库进行人脸检测和人脸识别萧鼎 python基础到进阶教程计算机视觉人工智能 python 人脸识别人脸检测
使用Dlib库进行人脸检测和人脸识别什么是Dlib？Dlib是一个广泛使用的C++库，提供了多种用于机器学习和计算机视觉的工具。它包含了人脸检测、人脸识别、物体检测、图像处理等功能。Dlib具有高效、易用的Python接口，因此它也被广泛应用于Python中进行深度学习和计算机视觉任务。安装Dlib首先，我们需要在Python环境中安装Dlib库。你可以通过pip进行安装：pipinstalldl
介绍常见的图片分类模型与算法萧鼎 python基础到进阶教程算法分类数据挖掘
介绍常见的图片分类模型与算法在机器学习和深度学习的领域中，图片分类任务是一个广泛的应用场景。随着深度学习技术的飞速发展，很多强大的图像分类算法和模型已经被提出，广泛应用于从医疗影像到自动驾驶、从人脸识别到图像检索等多个领域。本文将重点介绍多种用于图像分类的经典算法与模型，帮助你了解在图像分类任务中常用的技术。1.传统机器学习模型在深度学习崭露头角之前，传统的机器学习模型是图像分类的主流方法。这些模
Python图形界面开发：PyQt与Tkinter对比分析萧鼎 python基础到进阶教程 python pyqt 数据库
Python图形界面开发：PyQt与Tkinter对比分析图形用户界面（GUI）是应用程序中不可或缺的一部分，可以帮助用户更直观地与程序进行交互。Python拥有许多开发GUI的库，其中PyQt和Tkinter是最受欢迎的两个选择。本篇博客将从功能、易用性、性能、社区支持、学习曲线等角度对比分析这两个库，并通过一个简单的实战项目帮助你更直观地理解它们的差异。一、PyQt与Tkinter简介1.Py
网页自动化测试和爬虫：Selenium库入门与进阶萧鼎 python基础到进阶教程爬虫 selenium 测试工具
网页自动化测试和爬虫：Selenium库入门与进阶在现代Web开发和数据分析中，自动化测试和数据采集成为了开发流程中的重要部分。Python的Selenium库是一种强大的工具，不仅用于网页自动化测试，也在网页爬虫中得到了广泛的应用。本文将带你从Selenium的基础用法入手，逐步深入到进阶技巧，帮助你轻松应对网页自动化任务。一、Selenium简介与安装Selenium是一个浏览器自动化工具，可
Python中的PDF处理工具：PyPDF2和ReportLab使用指南萧鼎 python基础到进阶教程 python pdf pypdf2 reportlab
Python中的PDF处理工具：PyPDF2和ReportLab使用指南在日常工作和项目中，PDF文件处理是个常见需求，不论是合并报告、加密文档、填充表单，还是生成发票。Python中有许多用于操作PDF文件的库，其中PyPDF2和ReportLab是两个广泛使用的工具：前者用于PDF文档的读取和修改，后者用于从头生成PDF文件。在这篇博客中，我们将介绍如何使用PyPDF2和ReportLab完成
DeepSeek掘金——Deepseek + Lakehouse 架构赋能企业数字化转型不二人生大模型 DeepSeek掘金指南大模型 deepseek 数据湖
Deepseek+Lakehouse架构最近Deepseek这股风刮得太猛了，本周末的大事莫过于腾讯于2025年2月15日晚开始灰度测试在微信中接入DeepSeek-R1模型。作为一个月活将近14亿的国民级app，表达一个开放的意愿就已经能够让股价火箭上天。而另一面，笔者的朋友圈也都很躁动，众多企业朋友们都在热情入局Deepseek。今天想跟大家聊聊最近比较火的Deepseek私有部署+Lakeh
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &