vriverh

LangChain-Chatchat学习资料-Windows开发部署（踩坑篇）

系列文章目录

1.[LangChain-Chatchat学习资料-简介]
2.[LangChain-Chatchat学习资料-Windows开发部署]
3.[LangChain-Chatchat学习资料-Windows开发部署（踩坑篇）]
4.LangChain-Chatchat学习资料-Ubuntu安装Nvidia驱动和CUDA
5.LangChain-Chatchat学习资料-Ubuntu开发部署
6.LangChain-Chatchat学习资料-Ubuntu开发部署（踩坑篇）

文章目录

系列文章目录
LangChain-Chatchat学习资料-Windows开发部署（踩坑篇）
- 环境准备的坑
- - 1.CUDA版本问题
  - 2.Python依赖包问题
- 配置文件的坑
- chatglm-6b-int4的坑

LangChain-Chatchat学习资料-Windows开发部署（踩坑篇）

环境准备的坑

1.CUDA版本问题

我是用的RTX3060显卡，通过nvidia-smi命令，查看显卡支持的CUDA版本为12.2，然后下载版本的CUDA，后续发现这里是个坑，pytorch目前最新版为2.0.1，支持的cuda版本最高为11.8，所以想使用显卡跑pytorch，需要讲CUDA降到11.8版本。具体情况可查看pytorch的官网介绍

2.Python依赖包问题

1.依赖包安装不全
使用官方提供的requirements.txt进行依赖包安装，会出现包安装不完整的问题，需要根据后续服务启动报错，按照报错情况安装相对应的依赖包。

pip install accelerate

2.pytorch默认安装为CPU版本
如果想用GPU进行推理运算，需要安装pytorch的CUDA版本，使用官方提供的requirements.txt安装，只会安装CPU版本，后续运行起来非常慢。具体操作如下：

首先按照pytorch官方推荐方式，安装pytorch==2.0.1+cu118版本

# CUDA 11.8
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

再将requirements.txt中的torch~=2.0.0注释掉

#torch~=2.0.0

在使用requirements.txt安装依赖包

pip install -r requirements.txt

配置文件的坑

chatglm-6b-int4的坑

在使用int4量化模型时，使用pytorch的cpu版本时正常，使用cuda版本时，发生以下报错。

点击查看代码

2023-08-25 13:52:26 | ERROR | stderr | Traceback (most recent call last):
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\uvicorn\protocols\http\h11_impl.py", line 408, in run_asgi
2023-08-25 13:52:26 | ERROR | stderr |     result = await app(  # type: ignore[func-returns-value]
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\uvicorn\middleware\proxy_headers.py", line 84, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     return await self.app(scope, receive, send)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\fastapi\applications.py", line 290, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     await super().__call__(scope, receive, send)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\applications.py", line 122, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     await self.middleware_stack(scope, receive, send)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\middleware\errors.py", line 184, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     raise exc
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\middleware\errors.py", line 162, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     await self.app(scope, receive, _send)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\middleware\exceptions.py", line 79, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     raise exc
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\middleware\exceptions.py", line 68, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     await self.app(scope, receive, sender)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\fastapi\middleware\asyncexitstack.py", line 20, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     raise e
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\fastapi\middleware\asyncexitstack.py", line 17, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     await self.app(scope, receive, send)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\routing.py", line 718, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     await route.handle(scope, receive, send)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\routing.py", line 276, in handle
2023-08-25 13:52:26 | ERROR | stderr |     await self.app(scope, receive, send)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\routing.py", line 69, in app
2023-08-25 13:52:26 | ERROR | stderr |     await response(scope, receive, send)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\responses.py", line 270, in __call__
2023-08-25 13:52:26 | ERROR | stderr |     async with anyio.create_task_group() as task_group:
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\anyio\_backends\_asyncio.py", line 597, in __aexit__
2023-08-25 13:52:26 | ERROR | stderr |     raise exceptions[0]
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\responses.py", line 273, in wrap
2023-08-25 13:52:26 | ERROR | stderr |     await func()
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\responses.py", line 262, in stream_response
2023-08-25 13:52:26 | ERROR | stderr |     async for chunk in self.body_iterator:
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\concurrency.py", line 63, in iterate_in_threadpool
2023-08-25 13:52:26 | ERROR | stderr |     yield await anyio.to_thread.run_sync(_next, iterator)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\anyio\to_thread.py", line 33, in run_sync
2023-08-25 13:52:26 | ERROR | stderr |     return await get_asynclib().run_sync_in_worker_thread(
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\anyio\_backends\_asyncio.py", line 877, in run_sync_in_worker_thread
2023-08-25 13:52:26 | ERROR | stderr |     return await future
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\anyio\_backends\_asyncio.py", line 807, in run
2023-08-25 13:52:26 | ERROR | stderr |     result = context.run(func, *args)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\starlette\concurrency.py", line 53, in _next
2023-08-25 13:52:26 | ERROR | stderr |     return next(iterator)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\fastchat\serve\model_worker.py", line 231, in generate_stream_gate
2023-08-25 13:52:26 | ERROR | stderr |     for output in self.generate_stream_func(
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\utils\_contextlib.py", line 35, in generator_context
2023-08-25 13:52:26 | ERROR | stderr |     response = gen.send(None)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\fastchat\model\model_chatglm.py", line 71, in generate_stream_chatglm
2023-08-25 13:52:26 | ERROR | stderr |     for total_ids in model.stream_generate(**inputs, **gen_kwargs):
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\utils\_contextlib.py", line 35, in generator_context
2023-08-25 13:52:26 | ERROR | stderr |     response = gen.send(None)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\modeling_chatglm.py", line 1143, in stream_generate
2023-08-25 13:52:26 | ERROR | stderr |     outputs = self(
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\nn\modules\module.py", line 1501, in _call_impl
2023-08-25 13:52:26 | ERROR | stderr |     return forward_call(*args, **kwargs)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\modeling_chatglm.py", line 932, in forward
2023-08-25 13:52:26 | ERROR | stderr |     transformer_outputs = self.transformer(
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\nn\modules\module.py", line 1501, in _call_impl
2023-08-25 13:52:26 | ERROR | stderr |     return forward_call(*args, **kwargs)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\modeling_chatglm.py", line 828, in forward
2023-08-25 13:52:26 | ERROR | stderr |     hidden_states, presents, all_hidden_states, all_self_attentions = self.encoder(
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\nn\modules\module.py", line 1501, in _call_impl
2023-08-25 13:52:26 | ERROR | stderr |     return forward_call(*args, **kwargs)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\modeling_chatglm.py", line 638, in forward
2023-08-25 13:52:26 | ERROR | stderr |     layer_ret = layer(
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\nn\modules\module.py", line 1501, in _call_impl
2023-08-25 13:52:26 | ERROR | stderr |     return forward_call(*args, **kwargs)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\modeling_chatglm.py", line 542, in forward
2023-08-25 13:52:26 | ERROR | stderr |     attention_output, kv_cache = self.self_attention(
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\nn\modules\module.py", line 1501, in _call_impl
2023-08-25 13:52:26 | ERROR | stderr |     return forward_call(*args, **kwargs)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\modeling_chatglm.py", line 374, in forward
2023-08-25 13:52:26 | ERROR | stderr |     mixed_x_layer = self.query_key_value(hidden_states)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\nn\modules\module.py", line 1501, in _call_impl
2023-08-25 13:52:26 | ERROR | stderr |     return forward_call(*args, **kwargs)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\quantization.py", line 502, in forward
2023-08-25 13:52:26 | ERROR | stderr |     output = W8A16Linear.apply(input, self.weight, self.weight_scale, self.weight_bit_width)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive\miniconda3\envs\Langchain-Chatchat\lib\site-packages\torch\autograd\function.py", line 506, in apply
2023-08-25 13:52:26 | ERROR | stderr |     return super().apply(*args, **kwargs)  # type: ignore[misc]
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\quantization.py", line 75, in forward
2023-08-25 13:52:26 | ERROR | stderr |     weight = extract_weight_to_half(quant_w, scale_w, weight_bit_width)
2023-08-25 13:52:26 | ERROR | stderr |   File "C:\Users\vrive/.cache\huggingface\modules\transformers_modules\chatglm2-6b-int4\quantization.py", line 287, in extract_weight_to_half
2023-08-25 13:52:26 | ERROR | stderr |     func = kernels.int4WeightExtractionHalf
2023-08-25 13:52:26 | ERROR | stderr | AttributeError: 'NoneType' object has no attribute 'int4WeightExtractionHalf'

需要安装cpm_kernels包

pip install cpm_kernels

安装完毕后问题解决，可正常使用显卡继续推理计算。

C# 拖入文件只能拖入txt文件一念工作室 c#
要实现只能将.txt文件拖入Button控件（如button1）并获取其路径，可以在之前的基础上添加文件类型的检查逻辑。以下是具体实现步骤和示例代码：1.创建WindowsForms项目打开VisualStudio，创建一个新的WindowsForms应用程序项目。2.设计界面在窗体上添加一个Button控件，将其命名为button1。3.编写代码usingSystem;usingSystem.I
关于如何转换MarkDown文本并在Html内进行显示 Singe.Chen HTML html 前端
今天遇到一个问题，从ChatGpt的API获取的文本格式为MarkDown，在HTML上使用textarea控件显示的时候就只是文字格式，并没有对MarkDown格式进行处理，今天就分享一下如何在Html上进行MarkDown格式文本的显示1.创建一个HTML页面，包括textarea和一个用于显示Markdown内容的div：TextareatoMarkdown2.将文本输入到div控件的.in
WPF开发技巧：在WPF的DataGrid中实现动态增加列并刷新表格 Singe.Chen #WPF wpf
1.VM代码usingPrism.Mvvm;usingSystem;usingSystem.Collections.Generic;usingSystem.Collections.ObjectModel;usingSystem.Linq;usingSystem.Text;usingSystem.Threading.Tasks;usingSystem.Windows.Input;usingNewto
android 软键盘的显示和隐藏方法飞_哥 android 软键盘隐藏显示 android
方法一：在OnCreate()函数中，加上下面的代码getWindow().setSoftInputMode(WindowManager.LayoutParams.SOFT_INPUT_STATE_HIDDEN);12方法二：在AndroidManifest.xml中，在所要设置的activity中设置以下属性就行了activityandroid:windowSoftInputMode="stat
点击屏幕隐藏软键盘、软键盘显示/隐藏、windowSoftInputMode常用属性说明（禁止软键盘自动弹出、键盘遮挡问题） Mr_Leixiansheng android ui
转载请注明出处：点击屏幕隐藏软键盘、软键盘显示/隐藏、windowSoftInputMode常用属性说明（禁止软键盘自动弹出、键盘遮挡问题）_当软键盘显示时更多面板应该隐藏_Mr_Leixiansheng的博客-CSDN博客点击屏幕隐藏软键盘1，实现方法一：通过给当前界面布局文件的父layout设置点击事件（相当于给整个Activity设置点击事件），在事件里进行键盘隐藏加上id和clickabl
windows进阶-cmd命令云水一方运维 windows c语言
在Windows操作系统中，CMD提供了许多强大的命令，能够帮助用户执行一些更为高级的任务。这些命令不仅仅限于文件和目录的管理，还包括了服务管理、远程连接、注册表操作等功能。本文将介绍一些常见但较为特殊的CMD命令及其功能，帮助你更好地使用Windows命令行。1.sc–服务管理sc命令用于与Windows服务交互，可以启动、停止、配置或查询系统服务。这是一个功能强大的工具，尤其在进行系统管理时非
Deepseek两项关键发现：无需人类专家介入SFT、有自己极道Jdon javascript reactjs
DeepseekR1-Zero关键两项发现：无需人类专家、有自己专业领域语言DSL，也就是没有SFT，有自己DSL!ARCPrize基金会对DeepSeek发布的R1-Zero和R1“推理”系统的分析。ARCPrize基金是谁？ARCPrize基金会旨在定义、衡量并激励新的AGI（通用人工智能）想法。目前尚未实现AGI，主流AI行业和公众普遍认为通过扩大纯语言模型（LLM）的预训练规模就能实现突破
DeepSeek极端榨取硬件性能被曝光极道Jdon javascript reactjs
DeepSeek的出现是否意味着前沿LLM开发不再需要大规模GPU集群？简单来说：不是的。虽然DeepSeek的V3模型通过一些非常厉害的优化技术，让GPU的使用效率变得更高了，但这并不意味着像Google、OpenAI、Meta和xAI这些公司之前花大钱搞的大规模GPU集群就没用了。AI开发者的普遍看法是，大规模GPU集群仍然是训练顶尖AI模型的关键。DeepSeek做了什么？DeepSeek的
Ubuntu上如何优雅下载huggingface上某个gguf模型文件晨欣 ubuntu linux 运维
OS:Ubuntu22.04LTS需求：下载GorillaOpenfunctionsV2Q2GGUF模型到本地https://huggingface.co/gorilla-llm/gorilla-openfunctions-v2-gguf/blob/main/gorilla-openfunctions-v2-q2_K.gguf方法：使用wget命令wgethttps://huggingface.c
java development kit - 11 - jdk下载安装、环境变量设置「已注销」 java
目录JavaSE(StandardEdition,标准版)-11jdk下载jdk-11.0.6_windows安装设置环境变量JavaSE(StandardEdition,标准版)-11jdk下载如果懒得去官网下载可以直接在下面这个下载，然后跳过这一步，这个链接提供的是jdk11.0.6的Windows版本。官网其实也很坑，下载页面有时显示不出来，然后下载可能要注册登录。百度云--jdk-11.0
探索Java新境界：JDK 15.0.1 Windows 64位安装与环境配置指南房莺耘
探索Java新境界：JDK15.0.1Windows64位安装与环境配置指南【下载地址】JDK15.0.1Windows64位安装与环境配置指南分享JDK15.0.1Windows64位安装与环境配置指南欢迎使用JDK15.0.1，这是Oracle在2020年发布的Java开发套件的一个更新版本项目地址:https://gitcode.com/Resource-Bundle-Collection/
Linux系统python虚拟环境及HanLP部署段智华
在Linux系统中运行HanLP，要安装部署一个Python的虚拟环境，实现Python2与Python3的版本共存，Python虚拟环境与JavaJVM虚拟机的共存，HanLP是面向生产环境的多语种NLP工具包，HanLp的标记是一只蝴蝶，蝴蝶象征着蝴蝶效应、非线性与混沌理论——虽然微小，但足以改变世界！（《自然语言处理入门》图书作者何晗）Linuxopenssl、libssl-dev等模块安装
万字长文解读生成式AI参考架构俞凡 DeepNoMind 程序人生
本文介绍了构建端到端生产级GenAI应用的参考架构模型，涵盖了从UI/UX设计到多代理系统的各个方面，涉及AI模型的准备、调优、服务以及治理等关键环节。原文:TheGenAIReferenceArchitecture本文将介绍构建端到端GenAI应用的主要架构构件和蓝图，以便为生产做好准备，并且提出了几个在实施和设计基于LLM的应用时需要注意的关键事项。在目标架构中选择GenAI组件的AI成熟度：
登录ChatGPT的时候总是卡在“验证你是人类” 张biubiu chatgpt
登录Chatgpt时总是验证是不是真人，用了网上的三种方法，还是没有解决，最后把电脑连上手机热点，就可以成功使用Chatgpt。网上比较常用的解决办法（以谷歌浏览器为例）切换无痕浏览清除所有cookie。（Ctrl+Shift+Delete)。会提示清除多久的，是24小时之内的，还是一周之内的等等等。更换科学上网节点。（(软件的代理位置））如果上面三个都不行的话，建议关闭防火墙试试。关闭防火墙。最
Oracle11g下载与安装(windows) pingcode JAVA全栈开发笔记（全）JAVA前后端开发笔记 oracle
一、Oracle11g下载官网下载地址：OracleDatabase11gRelease2forMicrosoftWindows(x64)选择"AcceptLicenseAgreement"，点击"win64_11gR2_database_1of2.zip"和"win64_11gR2_database_2of2.zip"，进行下载。（下载前需登录Oracle账号，没有的话可以用邮箱注册一个，登录之
【Java】通俗易懂方法引用麻辣香蝈蝈 Java java python 开发语言 spring boot 学习方法 mybatis
Java系列文章目录补充内容Windows通过SSH连接Linux第一章Linux基本命令的学习与Linux历史文章目录Java系列文章目录一、前言二、学习内容：三、问题描述四、解决方案：4.1解释4.2使用场景4.3为何使用Lambda表达式五、总结：5.1方法引用主要有四种类型：5.2方法引用的好处一、前言方法引用学习与见方法引用理解一下wrapper.set(request.getName(
LLM模型部署经验分享 lewis_kai 阿里云语言模型
LLM模型部署经验分享作者：大连理工大学李凯首先，你需要选择一个合适的部署平台，这可以是本地服务器、云服务提供商（如AWS、Azure、GoogleCloud等）、边缘设备或者特定的部署服务（如HuggingFaceHub）。在这里我使用的是魔搭平台的云服务器。然后下载你要部署的模型，这里下载的是通义千问。下载并部署玩模型后，我们还可以对模型转换和优化，该文会介绍基于OpenVINO的模型量化实践
开源大模型（LLM）下载 baidu_20834545 语言模型
由于huggingface等国外网址无法访问或限制等问题，下载不了或下载速度慢。可以尝试从modespace（魔搭社区）下载。1、找到对应的模型文件，比如Meta-Llama-3-8B，然后找到下载入口2、点击模型下载，有2种下载方式，这里我们通过git下载（注意由于模型文件一般都比较大，直接使用gitclone下载时会有问题，超大文件下载后数据会缺失。可通过gitlfsclone命令）3、打开l
2024年大模型发展回顾与展望（上） Alsey_ 大模型发展回顾与展望人工智能
不觉间，ChatGPT已经诞生两年了。两年前，当大模型仍是一个相对陌生的概念，难以想象，今天它已经成为办公必备工具，席卷了各个行业，深刻改变着我们的工作方式。OpenAI引领大模型发展大模型的崛起可以追溯到几年前，最初的突破源自参数规模的增长。2018年，OpenAI发布了GPT-1，这款模型的参数量虽然只有1.17亿，但为后续的大模型奠定了基础。随着技术的进步，2019年OpenAI发布了GPT
【Docker】【Nacos】单机部署又言又语 Docker docker nacos 单机模式
【Docker】【Nacos】单机部署背景介绍环境步骤总结背景因国内访问DockerHub极不稳定，因此总结整理出本文，以便后续需要时方便查看。介绍本文介绍Docker安装Nacos并实现单机模式部署的方法及步骤。环境分类名称版本操作系统WindowsWindows11DockerDockerEngine25.0.3DockerDockerClient25.0.3DockerDockerDeskt
【LangChain编程：从入门到实践】数据库问答场景 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】数据库问答场景作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在现代信息社会中，数据的爆炸性增长使得如何高效地从海量数据中提取有用信息成为一个重要课题。数据库问答系统（DatabaseQuestionAnsweringSystem,DBQA）作为一种能够直接从数据库中获取答案的技术，
Z820安装Win7系统出现0X0000007B蓝屏报错无限重启的解决方法与相关问题 homelab HP Z系工作站商用电脑 windows 操作系统驱动程序
安装win7系统，一般有PE工具安装和ISO启动（光盘或U盘镜像）两种方法，但不管用哪种方法，都可能因没有加载硬盘驱动而失败，蓝屏在第二次重启后一闪而过，之后自动重启，陷入无限重启的死循环。这段信息为：AproblemhasbeendetectedandWindowshasbeenshutdowntopreventdamagetoyourcomputer.Ifthisisthefirsttimey
使用Ollama和Open WebUI快速玩转大模型：简单快捷的尝试各种llm大模型，比如DeepSeek r1 skywalk8163 人工智能人工智能 ollama DeepSeek
Ollama本身就是非常优秀的大模型管理和推理组件，再使用OpenWebUI更加如虎添翼！Ollama快速使用指南安装OllamaWindows下安装下载Windows版Ollama软件：Releasev0.5.7·ollama/ollama·GitHub下载ollama-windows-amd64.zip这个文件即可。可以说Windows拥抱开源真好，Windows下安装软件简单方便，开源软件直
计算ERA-5数据的相对湿度（RH）与饱和水汽压差（VPD） Vicissitudes_Aura 气象数据处理 python 图像处理
计算ERA-5数据的相对湿度（RH）与饱和水汽压差（VPD）目录计算ERA-5数据的相对湿度（RH）与饱和水汽压差（VPD）前言一、所使用的函数包以及操作系统二、具体操作及代码1.数据2.计算RH与VPD前言由于需要用到饱和水汽压差数据而ERA5中并没有饱和时气压差数据，故根据公式进行计算。一、所使用的函数包以及操作系统函数包：cdo操作系统：Windows10中的WSL二、具体操作及代码1.数据
怎么创建一个能在线测试php的html5网页？很酷的站长编程记录 html5专题 php专题 php html5 开发语言
代码示例：一、搭建服务器环境首先，你需要在服务器上搭建PHP运行环境。如果你使用的是Linux服务器，可以使用Apache或Nginx作为Web服务器，并安装PHP解释器。对于Windows服务器，可以使用WAMP（Windows,Apache,MySQL,PHP）或XAMPP等集成环境。二、创建HTML表单页面创建一个HTML页面，包含一个表单，用户可以在表单中输入PHP代码，将该代码提交到服务
程序员护眼指南：Windows设置护眼色英国老鼠_ 安装配置 windows 护眼色
白领工作难免长期面对电脑屏幕，时间长了会导致眼镜干涩、视力加深等问题，推荐走以下几步：（1）为显示器贴上防蓝光膜，可在淘宝上搜索“显示器防蓝光膜”（2）降低屏幕亮度，安装护眼软件，如f.lux，或在腾讯电脑管家中打开工具箱-健康小助手-护眼卫士来调整护眼色的色调。个人推荐后者。（3）佩戴防蓝光眼镜，可在京东上搜索“小米防蓝光眼镜”，在小米旗舰店上购买99元的防蓝光眼镜。近视的朋友建议下次配眼镜时加
PythonOCC安装步骤与注意事项我们的武平工作室 IFC学习相关 python bim anaconda
ifcbimifcxmlifcowl交流群。群号：10275989842020-0113补充：有网友提到了pyqt的安装不正确，这里给大家找到了一份安装方式。我自己也是使用该链接的pip安装方式安装的。因此后文没提，以为大家这个点不是问题。总之，有问题再更新！[PyQt]在Windows系统中安装PyQt5-乐松-博客园https://www.cnblogs.com/syh6324/p/94842
FFMpeg的基本介绍海峰丶丶丶 ffmpeg 音视频
1FFMpeg的基本概念1.1FFMpeg是什么FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。FFmpeg在Linux平台下开发，但它同样也可以在其它操作系统环境中编译运行，包括Windows、MacOSX等。这个项目最早由FabriceBellard发起，2004年至2015年间由
基于Python的Selenium详细教程总结（极简版） weixin_41663997 python selenium 开发语言
基于Python的Selenium详细教程总结一、PyCharm安装配置Selenium使用环境:Windows11,Python3.10.5,PyCharm2022.1.3,Selenium4.3.0需要技术:Python,HTML,CSS,JavaScriptSelenium安装:查看已安装的Python包:piplist安装Selenium4.3.0:pipinstallselenium==
掌握Python Selenium：网页元素自动化定位实战指南 jardonwang1 python selenium 自动化
一、Selenium框架介绍Selenium是一个用于自动化web应用程序测试的工具，它直接运行在浏览器中，就像真实用户在操作一样。这个框架支持多种浏览器（包括Chrome、Firefox、Safari等），并且可以在多种操作系统（Windows、Linux、macOS等）上运行。Selenium的主要目标是使自动化测试变得简单，以支持开发人员和测试人员快速编写测试用例。以下是Selenium框架
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

LangChain-Chatchat学习资料-Windows开发部署（踩坑篇）

系列文章目录

文章目录

LangChain-Chatchat学习资料-Windows开发部署（踩坑篇）

环境准备的坑

1.CUDA版本问题

2.Python依赖包问题

配置文件的坑

chatglm-6b-int4的坑

你可能感兴趣的:(LLM,langchain,windows,chatgpt,自然语言处理)