中古传奇

【搭建个人知识库-3】

搭建个人知识库-3

1 大模型开发范式
- 1.1 RAG原理
- 1.2 LangChain框架
- 1.3 构建向量数据库
- 1.4 构建知识库助手
- 1.5 Web Demo部署
2 动手实践
- 2.1 环境配置
- 2.2 知识库搭建
- - 2.2.1 数据收集
  - 2.2.2 加载数据
  - 2.2.3 构建向量数据库
- 2.3 InternLM接入LangChain
- 2.4 构建检索问答链
- - 1 加载向量数据库
  - 2 实例化自定义LLM与Prompt Template
  - 3 构建检索问答链
- 2.5 Web Demo
3 作业

基于InternLM和LangChain搭建专属个人的大模型知识库；

大模型开发范式
LangChain简介
构建

1 大模型开发范式

大模型具有简单的广度回答，但是在垂直领域的知识受限；

如何让LLM及时获得最新的知识
如何打造垂直领域大模型
如何打造个人专属的LLM应用

两种常用开发范式：RAG VS Finetune
即：检索增强生成 VS 算法微调；
RAG：

成本低
可实时更新
受基座影响大
单次回答知识有限

Finetune:

可个性化微调
知识覆盖面广
成本高昂
无法实时更新

1.1 RAG原理

1.2 LangChain框架

LangChain框架：是一个开源工具，为各种LLM提供通用接口来简化应用程序的开发流程，帮助开发者自由构建LLM应用；
LangChain的核心组成模块：

链：将组件实现端到端应用，通过一个对象封装实现一系列LLM操作；
Eg：检索问答链，覆盖实现了RAG的全部流程；

1.3 构建向量数据库

加载源文件–>文档分块–>文档向量化；

1.4 构建知识库助手

LangChain支持自定义LLM，可以直接接入到框架中；
只需将InternLM部署到本地，并封装一个自定义LLM类，调用本地的InternLM即可。

RAG方案优化建议：

1.5 Web Demo部署

支持简易Web 部署的框架：Gradio、Streamlit等；

2 动手实践

2.1 环境配置

1.安装环境，激活环境，并安装依赖
2.模型下载

直接从服务器copy；–不可取；
modelscope 中的 snapshot_download 函数下载模型，第一个参数为模型名称，参数 cache_dir 为模型的下载路径。

import torch
from modelscope import snapshot_download, AutoModel, AutoTokenizer
import os
model_dir = snapshot_download('Shanghai_AI_Laboratory/internlm-chat-7b', cache_dir='/root/data/model', revision='v1.0.3')

3.LangChain相关环境部署

4.下载NLTK相关资源
在使用开源词向量模型构建开源词向量的时候，需要用到第三方库 nltk 的一些资源。

2.2 知识库搭建

2.2.1 数据收集

OpenCompass：面向大模型评测的一站式平台
IMDeploy：涵盖了 LLM 任务的全套轻量化、部署和服务解决方案的高效推理工具箱）
XTuner：轻量级微调大语言模型的工具库
InternLM-XComposer：浦语·灵笔，基于书生·浦语大语言模型研发的视觉-语言大模型
Lagent：一个轻量级、开源的基于大语言模型的智能体（agent）框架
InternLM：一个开源的轻量级训练框架，旨在支持大模型训练而无需大量的依赖

开源使用方式

# clone 上述开源仓库
git clone https://gitee.com/open-compass/opencompass.git
git clone https://gitee.com/InternLM/lmdeploy.git
git clone https://gitee.com/InternLM/xtuner.git
git clone https://gitee.com/InternLM/InternLM-XComposer.git
git clone https://gitee.com/InternLM/lagent.git
git clone https://gitee.com/InternLM/InternLM.git

为语料处理方案，在这里只选用仓库中的MD、TXT文件作为示例语料库。
当然也可以选用其中的代码文件放入到知识库中，但是需要针对代码文件格式进行专门的额外处理。（代码文件对逻辑联系要求较高，且规范性较强，在分割时最好基于代码模块进行分割再加入向量数据库）。

创建函数：将仓库里所以满足条件的.md或.txt文件的路径找出来，定义一个函数：将该函数递归指定文件路径，返回其中所有满足条件的文件路径；

import os 
def get_files(dir_path):
    # args：dir_path，目标文件夹路径
    file_list = []
    for filepath, dirnames, filenames in os.walk(dir_path):
        # os.walk 函数将递归遍历指定文件夹
        for filename in filenames:
            # 通过后缀名判断文件类型是否满足要求
            if filename.endswith(".md"):
                # 如果满足要求，将其绝对路径加入到结果列表
                file_list.append(os.path.join(filepath, filename))
            elif filename.endswith(".txt"):
                file_list.append(os.path.join(filepath, filename))
    return file_list

2.2.2 加载数据

在上一步将所有目标文件的路径找出来之后，使用LangChain提供的FileLoader对象来加载目标文件，得到由目标文件解析出的纯文本内容。
不同类型文件对应不同的FileLoader：首先判断目标文件类型，并针对性调用对应类型的FileLoader，即调用FileLoader对象的load方法来得到加载之后的纯文本对象。
Python 真是好东西，实现简洁且可读性超级强

from tqdm import tqdm
from langchain.document_loaders import UnstructuredFileLoader
from langchain.document_loaders import UnstructuredMarkdownLoader

def get_text(dir_path):
    # args：dir_path，目标文件夹路径
    # 首先调用上文定义的函数得到目标文件路径列表
    file_lst = get_files(dir_path)
    # docs 存放加载之后的纯文本对象
    docs = []    # 得到一个纯文本对象对应的列表
    # 遍历所有目标文件
    for one_file in tqdm(file_lst):
        file_type = one_file.split('.')[-1]
        if file_type == 'md':
            loader = UnstructuredMarkdownLoader(one_file)
        elif file_type == 'txt':
            loader = UnstructuredFileLoader(one_file)
        else:
            # 如果是不符合条件的文件，直接跳过
            continue
        docs.extend(loader.load())
    return docs

2.2.3 构建向量数据库

在上一步得到纯文本对象的列表之后，将它引入到LangChain框架中构建向量数据库。由纯文本对象构建向量数据库，先对文本进行分块，接着对文本进行向量化。

1.#LangChain有多种文本分块工具，在这里使用字符串递归分割器
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500, chunk_overlap=150)
split_docs = text_splitter.split_documents(docs)

2.选用开源词向量模型进行文本向量化
from langchain.embeddings.huggingface import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings(model_name="/root/data/model/sentence-transformer")
3.将Chroma作为向量数据库，基于上文分块后的文档以及加载的开源向量化模型，将语料加载到指定路径下的向量数据库：
from langchain.vectorstores import Chroma
# 定义持久化路径
persist_directory = 'data_base/vector_db/chroma'
# 加载数据库
vectordb = Chroma.from_documents(
    documents=split_docs,
    embedding=embeddings,
    persist_directory=persist_directory  # 允许我们将persist_directory目录保存到磁盘上
)
# 将加载的向量数据库持久化到磁盘上
vectordb.persist()

2.3 InternLM接入LangChain

为方便构建LLM应用，基于本地进行部署InternLM，继承LangChain的LLM类自定义一个InternLM LLM子类，从而实现将InternLM接入到LangChain框架中。
完成 LangChain 的自定义 LLM 子类之后，可以以完全一致的方式调用 LangChain 的接口，而无需考虑底层模型调用的不一致。

from langchain.llms.base import LLM
from typing import Any, List, Optional
from langchain.callbacks.manager import CallbackManagerForLLMRun
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

class InternLM_LLM(LLM):
    # 基于本地 InternLM 自定义 LLM 类
    tokenizer : AutoTokenizer = None
    model: AutoModelForCausalLM = None

    def __init__(self, model_path :str):
        # model_path: InternLM 模型路径
        # 从本地初始化模型
        super().__init__()
        print("正在从本地加载模型...")
        self.tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
        self.model = AutoModelForCausalLM.from_pretrained(model_path, trust_remote_code=True).to(torch.bfloat16).cuda()
        self.model = self.model.eval()
        print("完成本地模型的加载")

    def _call(self, prompt : str, stop: Optional[List[str]] = None,
                run_manager: Optional[CallbackManagerForLLMRun] = None,
                **kwargs: Any):
        # 重写调用函数
        system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
        - InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
        - InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
        """
        
        messages = [(system_prompt, '')]
        response, history = self.model.chat(self.tokenizer, prompt , history=messages)
        return response
        
    @property
    def _llm_type(self) -> str:
        return "InternLM"

在上述类定义中，我们分别重写了构造函数和 _call 函数：对于构造函数，我们在对象实例化的一开始加载本地部署的 InternLM 模型，从而避免每一次调用都需要重新加载模型带来的时间过长；_call 函数是 LLM 类的核心函数，LangChain 会调用该函数来调用 LLM，在该函数中，我们调用已实例化模型的 chat 方法，从而实现对模型的调用并返回调用结果。
在Python中看到了类似C++中的用法

2.4 构建检索问答链

LangChain 通过提供检索问答链对象来实现对于 RAG 全流程的封装。所谓检索问答链，即通过一个对象完成检索增强问答（即RAG）的全流程。
原理：调用一个 LangChain 提供的 RetrievalQA 对象，通过初始化时填入已构建的数据库和自定义 LLM 作为参数，来简便地完成检索增强问答的全流程，LangChain 会自动完成基于用户提问进行检索、获取相关文档、拼接为合适的 Prompt 并交给 LLM 问答的全部流程。

1 加载向量数据库

将上文构建的向量数据库导入进来，直接通过Chroma以及上文定义的词向量模型来加载已构建的数据库：

vedtordb对象即为已经构建好的向量数据库对象，它可以针对用户的query进行语义向量检索，得到与用户提问相关的知识；

2 实例化自定义LLM与Prompt Template

实例化一个基于InternLM自定义的LLM对象：

3 构建检索问答链

调用 LangChain 提供的检索问答链构造函数，基于我们的自定义 LLM、Prompt Template 和向量知识库来构建一个基于 InternLM 的检索问答链：

2.5 Web Demo

上面两个小节分别完成之后，搭建基于Gradio框架部署到网页，搭建一个小型的Demo，这样便于测试和调试；

将上面的代码封装成一个函数：用于返回构建的检索问答链对象的函数。在启动Gradio的initial时调用函数得到检索问答链对象，后续直接使用该对象进行问答对话，避免重复加载模型；
定义一个类：负责加载并存储检索问答链，响应Web界面里调用该检索问答链进行回答的动作；
按照Gradio框架使用方法，实例化一个Web界面并将点击动作绑定到上述类的回答方法即可。
启动上面封装的脚本，默认会在7860端口运行，因此做好服务器端口与本地端口映射。
ssh -L 7860:127.0.0.1:7860 [email protected] -p 34825

3 作业

你可能感兴趣的:(大模型)

YOLO 目标检测的改进方法
YOLO目标检测的改进方法可以从模型架构、训练策略、损失函数等多个方面入手，以下是一些常见的改进方法方向及参考文献：模型架构改进骨干网络替换：使用更轻量或更强大的网络替换原始骨干网络。轻量级网络如MobileNetV3、ShuffleNetV2等适合移动端部署，可提高推理速度；高性能网络如ConvNeXt、SwinTransformer等能提取更丰富的语义特征，提升检测精度。还可添加CBAM、SE
2024年淘宝中秋节活动力度大吗？淘宝中秋节有什么活动？氧惠购物达人
2024年淘宝中秋节活动力度相当大，不仅优惠幅度令人惊喜，而且活动形式多样，覆盖了众多商品类别。以下是对淘宝中秋节活动的概括：活动力度大满减优惠：淘宝平台联合众多商家，推出了大规模的满减活动。预计满减力度可能包括满100减50、满200减100等，甚至可能有满300元减30元、满600元减60元的基础档位，具体满减力度需关注淘宝官方公告。折扣优惠：除了满减活动，淘宝还可能推出折扣优惠，让消费者在购
蒋勋《人生十讲》叶小静Stamy
每次读蒋勋，都有收获。上一次大规模地读是大三大四，蒋老师的声音陪我走过那段迷茫浮躁的时间。这一次偶然在书店又遇到这本书，内心又被其中的观点给震撼。原来很多问题，我还是缺少深入思考。比如教育。工作两年，虽对教书感兴趣，但育人一直投入不够。很多时候看学生懒，总觉得孺子不可教。却忘了这个年纪正是学生迷茫的年纪，需要关心和爱。爱这个字谈起来好像总觉得空洞，让人有种难以启齿的感觉，但这可能正是我们不懂如何爱
霜降李龙邦
霜降，是二十四节气之第十八个节气。斗指戌；太阳黄经为210°；每年公历10月23—24日交节。霜降是秋季的最后一个节气，是秋季到冬季的过渡。霜降节气特点是早晚天气较冷、中午则比较热，昼夜温差大，秋燥明显。由于“霜”是天冷、昼夜温差变化大的表现，故以“霜降”命名这个表示“气温骤降、昼夜温差大”的节令。霜降时节，万物毕成，毕入于戌，阳下入地，阴气始凝。俗话讲“霜降杀百草”，霜降过后，植物渐渐失去生机，
HTTP性能优化终极指南：从协议原理到企业级实践
前言：为什么性能优化是Web开发的生命线？根据Google研究数据，当页面加载时间从1秒增加到3秒时，跳出率提升32%；当达到5秒时，转化率下降90%。本文将通过七层优化体系，带您掌握HTTP性能优化的核心技术，包含：8大核心优化方向12个真实企业案例20+可立即落地的配置代码最新HTTP/3实践方案一、网络层优化：从DNS到HTTP/3的全栈加速1.1智能DNS解析体系//动态预解析用户可能访问
分类模型（BERT）训练全流程巴伦是只猫人工智能分类 bert 数据挖掘
使用BERT实现分类模型的完整训练流程BERT(BidirectionalEncoderRepresentationsfromTransformers)是一种强大的预训练语言模型，在各种NLP任务中表现出色。下面我将详细梳理使用BERT实现文本分类模型的完整训练过程。1.准备工作1.1环境配置pipinstalltransformerstorchtensorflowpandassklearn1.2
每日心语：让生命之花绚烂绽放把平平凡凡的生活过成诗与远方
我一直坚信，有生命就要有梦想。有梦想生命才无价！我的梦想——把平平凡凡的生活过成诗与远方。听起来很有诗意对吧。可想把平平凡凡的生活过成富有诗意的诗与远方，是需要觉醒的。实现梦想的过程正是一次次觉醒生命的历程。（一）认知生命我初中是在坡胡三中上的。记得初中上早读时，尤其大冬天，从家出门，天还黑洞洞一片呢！去学校的途中，要经过王庄村东头的一片坟地。当时上学时，经常是村上我们三五个男生女生结伴而行。男生
Java学习----NIO模型典孝赢麻崩乐急 java 学习 nio
在Java的I/O模型中，NIO（Non-BlockingI/O，非阻塞I/O）是对BIO的重要改进。它为高并发场景提供了更高效的处理方式，在众多Java应用中发挥着关键作用。NIO模型的核心在于非阻塞和多路复用，其采用“一个线程处理多个连接”的模式，主要依靠通道（Channel）、缓冲区（Buffer）和选择器（Selector）这三个核心组件协同工作，每个核心组件的功能原理和功能如下：（1）通
6大茶类特点一抹暖茶
图片发自App白茶基本特征是：色白隐绿，汤色黄白，滋味鲜醇，清香甘美，属轻微发酵茶。主要产于福建福鼎、建阳、政和、松溪等地。白茶分为白芽茶和白叶茶。知名白茶有：①白毫银针，产于福鼎、政和等县；②白牡丹，产于建阳、政和、松溪、福鼎等县；③贡眉（寿眉），产于建阳、浦城等县；④天目湖白茶，产于江苏常州溧阳市天目湖旅游区。2.红茶基本特征是：香高、色艳、味浓，叶红汤红，滋味浓厚甘醇，似桂圆汤，有的松烟香味
熬夜之后吃什么养生食物来补身体？2022-12-29 ffd7b3b7d90f
熬夜之后吃什么养生食物来补身体?因为工作，学习等方面的原因，现如今的年轻人越来越多地开始经常熬夜。都提倡早睡早起，很明显地说明熬夜晚睡对身体有害。有时候年轻人因为年轻身体好，不觉得熬几天夜有什么。但其实熬夜的危害特别大，如果你熬了夜，第二天一定要补回来的。一、需要的营养素1、补水。水是生命之源，熬夜的你，生物钟被打乱，代谢加快，体内的水循环出现异常。所以必须要补充足够的水分来滋养你的身体。2、维生
边缘计算监控突围：Prometheus在5G MEC环境中的瘦身方案
作者：开源大模型智能运维FreeAiOps引言：5GMEC场景下的监控挑战与机遇随着5G多接入边缘计算（MEC）的普及，监控系统面临前所未有的挑战：资源碎片化：边缘节点通常部署在资源受限的硬件上（如ARM服务器、工业网关），CPU和内存容量仅为传统云服务器的1/5网络波动性：MEC设备常位于基站侧或工厂车间，面临高丢包率（5%-15%）和间歇性断网问题数据爆炸：单台MEC设备可能承载数百个物联网终
启发-日更专栏2021-04-20|日更第102天|中英双语 E介俗人
每天用100字，体味生活五味。欢迎关注，b站//知乎/头条/公/号/大/鱼/号同名：E介俗人还是先来一波推荐：【阅后启发】一分钟物理：物理勿理，你不用理它就是了-2021-W12如此阳光的一天。今天我仍要出去找租房。今天或许是个漫长的日子，我还要骑一天的车。希望能快点找到吧。Day100Whatasunnyday!TodayIwillstilllookingforaplacetosettledow
复刻表劳力士哪款最真(盘点十款最真的复刻劳力士手表高品质复刻手表商家
实测对比：劳力士高仿的表值得买吗？性能与原装大PK！劳力士，这个名字在腕表界如同璀璨星辰，令人向往。然而，真品与仿品之间的界限，往往让人心生疑虑。今日，我们不谈正统，不议真假，只论劳力士高仿的表，是否真的值得你我倾心一购？一、精湛工艺，复刻传奇劳力士高仿的表值得买吗？“工欲善其事，必先利其器。”高仿劳力士，其工艺之精，足以让行家侧目。它们不仅仅是模仿，更是对经典的一种致敬与传承。二、价格亲民，魅力
金庸续书《西毒欧阳锋大传》承接射雕三部曲，是査良居士的代表作青莓时代
在以写金庸武侠续作而成名的小说作家群体中，查良居士的名字不可不提。他的“金庸著名人物传记系列”，许多金庸武侠爱好者都看过。江湖传言，此系列已经与金庸的射雕三部曲系列构成了奇妙的血缘关系。金庸著名人物传记系列更有人言：读查良不读金庸不行，读金庸不读查良不完美！接下来，青莓时代就带大家一起走进查良居士的“金庸著名人物传记系列”，看看它究竟写了什么内容，到底写得怎么样。旧武侠书在这里，欢迎一起交流！十五
深圳市十大无创亲子鉴定中心大全(附2024年9月汇总鉴定) 中量亲鉴生物
深圳哪里可以做无创亲子鉴定？在深圳市盐田区盐梅路的国权基因可以做无创亲子鉴定咨询。为了帮助市民更好地了解和选择深圳的无创亲子鉴定机构，我们提供2024年最新的深圳无创亲子鉴定中心名录。本文将详细介绍这些鉴定中心的地址、工作时间、业务范围，以及选择适合自己的鉴定机构等信息，以助您在需要时能轻松找到合适的无创亲子鉴定服务。1、深圳市第二人民医院（福田区）地址：深圳市福田区笋岗西路2、北京中医药大学深圳
家庭服务具身智能机器人体系架构
硬件方面：差速移动机器人+六轴协作机械臂，软件方面选择ROS系统：底盘控制move_group，机械臂操纵MoveIt，大模型方面采用VLM+LLM：（1）视觉语言模型（VLM），用来实现环境理解与指令解析，候选模型为LLaVA和Qwen-VL。微调VLM需要2~4周，工作量主要是准备环境数据和标注期望输出。（2）大语言模型（LLM），用来实现任务分解与技能调用，候选工具有LangChain（任务
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
互相学习似水年华平
今晚受群内班主任的邀请，和大家分享我的学习心得。在晚上的分享会上，我听到了分享姐妹在讲述她们的故事，我不禁感叹，姐妹们的生活都是非常自律、人生有着清晰的目标。主播100课程班姐妹分享她每天早上如何练声，以及练声小技巧。蜕变100课程班姐妹分享她如何通过学习，制定人生的小目标、大目标以及终级目标。形象管理课程姐妹分享如何通过合理搭配穿衣打扮来提升自己的自信心。我和大家分享的是通过学习情商课，让我知道
十大广告赚钱平台APP排行榜：一天收益50元天花板软件曝光清风导师
十大广告赚钱平台APP排行榜，实测2024年看广告一天50元收益是真的还是骗局?最近小编发现很多赚钱副业项目开始返璞归真，简单说就是随着管理的越来越严格，现在一些新模式或者特别火爆的玩法会比较低调，反而是老玩法旧瓶装新酒优化升级了许多，比如广告赚钱类型，很多人过去印象并不好，不过现在甚至有些软件可以做到日赚50+的利润，确实是另外眼前一亮。广告赚钱日赚50+是真的吗?实事求是的评级，在过去几年广告
阿里云大模型ACP认证模拟考试（五）
考试重要提示：答题开始即开始计时，中途不可暂停，如超时则自动提交。本次考试共计100道题目，试卷总分100分，通过考试的成绩为80分及以上。请务必在120分钟内完成交卷，由于考试过程不可暂停，请您提前规划好个人时间，若未能在规定时间内交卷，本次考试成绩将判定无效。在开始答题前，系统会进行严格的身份验证流程。届时，请您准备好身份证，拍摄并上传身份证的人像面照片，同时按照系统的指引，开启摄像头完成面部
安全居住判断五个要点。独孤派
【找房子前考虑居住环境是否安全~】五点因素判断一个居住环境是否安全,需考虑这五点因素很多人在外打拼就面临租房的问题,租房要考虑的最重要的一点就是安全。要获得一个安全的居住环境,从选房开始就要仔细把关。判断一个居住环境是否安全,就要考虑到这五点因素。一、当地新闻输入该小区路段名、小区、片区名等,看看是否有发生过违法犯罪的新闻,甚至交通事故新闻也要留意,因为有的路段晚上通行的大货车、运渣车较多,或路灯
可转债投资之——小盘可转债大秀大长腿蛙声叫叫一家亲
“感觉许久没提可转债了，这段时间确实没啥好说的，可转债价格跟随正股不断下跌，可转债等权指数从3月初冲高后持续回落，这几天稍微企稳。最近有个特别值得一提的现象，就是许多小规模转债，特别是次新小规模转债，轮番轰炸暴涨，天天秀着20cm、30cm的大长腿，看着让人眼馋。先说说蛙哥最近的可转债持仓情况，截至发文前，今年可转债亏损3.78%，仓位上升到80.68%。整体趋势是亏损仍在缓慢小幅加大，仓位却在上
【大模型记忆实战Demo】基于SpringAIAlibaba通过内存和Redis两种方式实现多轮记忆对话 Sao_E redis 数据库缓存 ai 语言模型
文章目录多轮对话记忆管理——基于Memory的对话记忆基于内存存储历史对话基于Redis存储历史对话多轮对话记忆管理——基于Memory的对话记忆SpringAIAlibaba共实现了三种方式：基于内存的方式基于jdbc（数据库）的方式基于redis的方式下文主要演示基于内存和redis的方式基于内存存储历史对话代码首先定义大模型的角色，一个旅游规划师设置增强拦截器接着接口传入prompt和cha
中原焦点团队分享网初31期李丽坚持第26天 2021.11.6 遇见_afaf
创造成功经验——让孩子重获信心1.相信一个小小的改变会带来大变化，达到滴水穿石的效果。就像平时我们所说的多米诺骨牌效应一样，我们要关注的就是孩子那一点点的成功经验，让他不断的增加体验，就会有大的变化。2.“再保证”指的是我们对孩子表达：不管发生什么事，我都会爱你这个人，也许你的行为需要修正，但我不会因为你的行为不喜欢你。让孩子感受到不管发生什么事儿，父母永远都爱他，不管发生什么事儿，父母永远都会陪
179.我们的情绪为何总被他人左右韩峰财商觉醒
《我的情绪为何总被他人左右》作者阿尔伯特埃利斯是20世纪美国著名的心理学家理性情绪行为疗法之父。他在美国心理学界的十大应用心理学家排行榜上排名第二，超过了弗洛伊德，他在心理学方面的研究成果被小布什、克林顿、希拉里等一些美国政要倍为推崇。这些内容能帮助我们解决生活中、工作中的心理和情绪问题，能够帮助很多人走出那种情绪困扰。财务自由之路的主题里为什么讲开心理学的内容呢？实际上很多人在追求财务自由的路上
10分钟搞定 MinIO 单节点多磁盘部署！打造稳定高可用对象存储【二】
MinIO是一个**高性能、开源的对象存储系统**，主要用于存储非结构化数据（如图片、视频、文档、备份等），与AmazonS3完全兼容。它被广泛用于云原生应用、大数据分析、AI模型存储、容器平台（如Kubernetes）等场景。MinIO支持多种部署模式，其中：单节点单磁盘（Single-NodeSingle-Drive）模式适用于开发测试、小规模应用或资源受限的场景。它的部署简单，不依赖集群、分
淘宝客服招聘在家兼职?十大适合孕妇的小生意日常购物小技巧
淘宝客服招聘在家兼职?十大适合孕妇的小生意随着互联网的普及，越来越多的孕妇选择在家创业，既能照顾宝宝，又能实现经济收入。本文为您推荐十大适合孕妇的小生意，让您在家轻松赚钱。一、淘宝客服兼职淘宝客服兼职是孕妇在家创业的不错选择。只需具备一定的沟通能力和责任心，就能在家为客户提供优质的售后服务。此外，淘宝客服兼职时间灵活，可以根据孕妇的身体状况和宝宝作息进行调整。至于我为何用这款氧券app，当然是氧券
刀神传说：第87章梁秀篇（1）刀神传说
两个月后。“此身合是诗人未？细雨骑驴入剑门。”剑门关天下奇险，双翼插天，群峰环立，真是“剑阁峥嵘而崔嵬，一夫当关，万夫莫开。”出剑门。梁秀、阮闲、刘零、山滔四人走在古柏夹道上。刘零开口道：“山老爷，刀神李流水据说武功天下第一，我不服！”山滔眼神茫然，抚着稀稀疏疏的白须，有气无力道：“为啥不服？”刘零大声道：“江湖中卧虎藏龙，学武之人千千万万，难道他都比试过？”阮闲附和：“真人不露相，露相不真人。我
PD分离技术分析老兵发新帖人工智能
PD分离中的“PD”指的是大语言模型（LLM）推理过程中的两个核心阶段：Prefill（预填充）和Decode（解码）。这两个阶段在计算特性和资源需求上存在显著差异，分离部署可优化整体性能。以下是详细解析：一、PD的具体含义Prefill（预填充阶段）任务：处理用户输入的整个提示（Prompt），为所有Token生成初始的键值缓存（KVCache）和隐藏状态（HiddenStates）。特性：计算
大模型微调技术的详细解析及对比老兵发新帖人工智能大数据
以下是四种主流大模型微调技术的详细解析及对比，结合技术原理、适用场景与性能表现进行说明：1.Full-tuning（全量微调）核心原理：加载预训练模型的所有参数，用特定任务数据（通常为指令-回答对）继续训练，更新全部权重。相当于对模型整体知识结构进行重构。操作流程：加载预训练模型；用任务数据集（如分类文本）和优化目标（如最小化误差）训练；所有参数参与梯度更新。优势：模型充分学习任务特征，效果通常最
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他