亲爱的数据

美国大模型风向速报（一）为何重视提示工程？LangChain+向量数据库+开源大模型真香...

多家，且独家来自美国的信源同时向“亲爱的数据”表示，

提示工程（Prompt Engineering）在美国大模型领域备受重视。

读者都要聊，

那就干活。

（一）开源真香

现阶段，AI开源极客大展身手，新的软件栈正在形成之中。

开源很香，但是开源是零收费，但不是零成本。

甲方着急用大模型，甲方管理层内心OS：

谁耽误我用大模型，我和谁急。

打工人，打工魂，集体上线。

要不玩一把“LangChain+向量数据库+开源大模型=线上模型服务”？

这几步看上去一点也不“卡脖子”，实则未必，

做完就可以“宣布”这是知识产权了。

讲两个小故事：

第一个小故事

某基金机构领导看到了ChatGPT的威力，要求使用，开发团队安排一下：

第一件事，收集数据；

第二件事，找各种基础开源模型；

第三件事，构建测试大模型的工程代码；

第四件事，各种都测试一遍；

第五件事，选出基础模型；

第六件事，封装成一个模型服务。

第七件事，几乎结束，但仍需业务团队顺利“接棒”。

尽管麻烦事儿有点多，老板依然会说：

市面上，AI开源工具这么多，做一个大模型应用应该不难，内部团队搞定，实在不行再招几个人。

“感谢老板栽培，您说得对，市面上开源工具确实很多，有的还很香。”

包括：

1. 游泳健身和LangChain了解一下：

LangChain用于调试、测试、评估和监控大语言模型应用的开源平台。

LangChain原生支持3个向量数据库，都被封装成统一接口，屏蔽了各自实现的细节。

既然封装好了，用的时候直接安装，动作很简单，就一行代码：pip install chromadb。

2.走过路过，不要错过开源向量数据库

用Chroma，还可以用脸书公司开源的FAiSS（全称为Facebook AI Similarity Search），但后者是个索引库。

3.家人们，开源底层算法大模型挑选一下

说到底基础大模型不就是个供应商嘛。

那么，用开源模型羊驼（Llama2），还是用商业GPT4？

然而，想走通“大模型服务”这条路，没想象的这么简单。

往往模型服务还没开始，人已经“累死”半路了。

躬行实践，底层劳动人民才会有真实的生产体验，老板不理解。

第二个故事：

理想中：用某一个科技公司已有的线上模型服务。

全剧终。

理想还是要有的，万一实现了呢。

（二）Lepton.AI

以Lepton.AI 为例，我们近距离观察一下：

Lepton.AI平台上的一个功能叫TUNA（吞拿鱼）。

名字的由来是据说创始团队成员爱吃吞拿鱼，

这让我想起了Snowflake公司几个创始人都喜欢滑雪。

“亲爱的数据”创始人爱吃西瓜。

用户在Lepton.AI 平台上，上传公司的数据集（最小需200条对话以上，截止目前最大是4.5M）。

先数据增强，再微调。

当然，客户不用管这些，他们眼中的步骤就是：

上传小数据集，你提出问题，产品回答。

TUNA（吞拿鱼）既包括增强数据功能，也包括大模型微调，这些都是技术活。

如何增强数据？

这个技术点，可以说是每个团队的看家本领，外人很难得知。

大致上，

好比原来只有1个G的数据，生成10个G的数据，再去掉8个G的数据垃圾。

剩下的虽不多，好歹有2个G的数据能用，怎么说也比一开始翻了2倍的数据量。

上传数据集后，先增强数据，再微调大模型。

用户可直接获得模型服务的结果。

最终完成模型服务的最后一公里。

服务可有两种方式：

要么一问一答。

要么抽成结构化数据。

然后，就没有然后了。

虽然是一个应用，但是体现出其背后工具链的价值，数据增强加上微调模型，灵便顺手，好用易用。

这个方案即使用开源软件，每一个步骤精细实现，再有机结合，直到产品化，难度还不小。

时间和人力都是成本。

当然，直接调用模型服务的产品最为方便。

AI落地需要灵便产品。

AI落地和商业模式的成功，不是单纯靠技术。

看上去Lepton.AI这家公司想让AI模型服务上线更快，让AI应用落地更快。

用咨询公司腔调表述这件事就是：

数据与大语言模型间的协同作用，增强了AI应用服务的整体性能，同时为更多创新和发现开辟出新可能性。

（三）聊聊细节

评价一个AI应用，用效果说话。

Lepton.AI所选的是财报会议场景，使用者可以是：摩根大通、高盛和摩根士丹利这帮投资人和专业投资分析师。

我们分析一下Lepton.AI的生成结果。

最开始，Lepton.AI的设置如图蓝色底色所示：

“使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答案。”

用技术术语表达，这些是Instruction。

与大语言模型会话，定义前置规则非常重要，包括角色，场景等等。

因为相同的内容，对不同的人，不同的场景可能意思不同。

一个会话机器人不可能一上来就知道你是谁，是什么场景下的问话，是想要创意性的回答还是严谨的回答等等。

此后，就是大模型的推理过程了，分为三部分：

第一个部分是输入，

第二部分叫处理，

第三个部分是输出。

既然是推理，在第一个部分输入，相当于给微调后的大模型“喂”了新数据。

或者说通过提示（Prompt）引导大模型。

这里用到了向量数据库。

我们知道，向量数据库可以通过向量相似度搜索快速检索相关数据，与传统的基于索引的数据库相比，查询速度快。

结构化的数据从向量数据库提取出来后，喂给大模型，大模型生成了提问问题的答案。

这个输入（Input），是这里面灰色底色，且没有高亮的这些字。

与传统预训练微调的方法不同，大模型推理中所用到的输入提示（Prompt），是从向量数据库里检索而来。

而LangChain在大语言模型输入阶段，通过检索向量数据库获取最相关的信息，将信息整理组合成为提示（Prompt），输入大模型，并得到产出结果。

这里还会用到召回增强型的生成技术。

英文名，Retrieval Auqmented Generation，是基于向量数据库，在上下文中去做内容摘要。

是一种增加大模型推理能力的技术。

产品效果如图：

能观察得到，产品界面能看到除答案之外的更多内容——结构化数据。

谭老师推测，Lepton.AI团队“特意”让大家看到从向量数据库里检索而来的“更多内容”。

用向量数据检索到了什么，本来是幕后工作，用户可以不知道。

“特意”意味着将输入内容也一起展示给大家看。

展示了什么内容？

给模型输入的内容都一样：用了同样的向量数据库，用了同样的数据。

那么更容易对比观察出：谁的效果更好，更“哇塞”？

第二部分，处理（Processing）。

本质上，这部分是对用户不可见的，是幕后工作。

无论是数学方法还是其他。

第三部分，大模型的输出就是给出的答案。

如图所示，模型往外面输出这个结果是绿色底色的是生成的部分。

看上去，原来的电话财报会议的文字内容被切成一段一段，

前面是结构化的数据（灰色底色），后面是问题的答案（绿色底色）。

图片字太小，我们粘出来看。

提问：

Can you discuss the potential for further growth in the number of Apple devices per iPhone user? Additionally, could you elaborate on how the monetization per user might vary between highly engaged "super users" and those who are not as deeply integrated into the Apple ecosystem?

你能谈谈iPhone用户拥有的苹果设备数量进一步增长的潜力吗？

另外，能否详细说明一下，在高度参与的“超级用户”和那些没有深度融入苹果生态系统的用户之间，每个用户的营收可能会有什么不同？

ChatGPT 3.5的答案：

Based on the provided context, Luca Maestri does not discuss the potential for further growth in the number of Apple devices per iPhone user or how monetization per user might vary between highly engaged "super users" and those who are not as deeply integrated into the Apple ecosystem.

基于上述内容，Luca Maestri并没有讨论iPhone用户的苹果设备数量的进一步增长潜力，也没有讨论每名用户的营收在高度参与的“超级用户”和那些没有深度融入苹果生态系统的用户之间的差异。

Lepton.AI的答案：

The number of active devices per user continues to grow and set new records. And the number of active devices per user is a very good indicator of the strength of our ecosystem and the ability to achieve future growth. As we've said in the past, we're not publishing the number of active devices per user, but the number of active devices per user set new records in the March quarter, and it's a very good indicator of the strength of our ecosystem.

活跃用户设备数量继续增长，并创造了新的记录。活跃用户设备数量这一指标很好地反映了苹果公司生态系统的实力和未来实现增长的能力。正如我们之前所说，不会公布活跃用户设备数量，但这个指标在第三季度创下了新的纪录，这是有力证明我们生态系统实力的一个很好的指标。

所见即所得。

Lepton.AI和OpenAI的模型在同样的输入的情况下，Lepton.AI的模型能够做得更好。

因为使用了行业数据进行模型微调，当然，谁也不知道Lepton.AI使用的基础模型是哪个，正如我开头所说，这些都是“知识产权”。

“亲爱的数据”读者群的群友表示：

“（这个时间段），来个LangChain和向量数据库最佳实践，包括选型建议。出书，保证大卖。”

谭老师我听罢，狠狠点了点头，并且开始脑补当上白富美，迎娶CEO。

醒一醒。

我们细看了Lepton.AI的做法，其中的提示工程非常重要。

的确，LangChain+向量数据库+开源模型是一种非常务实的做法，做大模型空谈概念无用。lepton.AI是文章中举的一个例子，想得到一个好的结果，既靠提示工程（Prompt Engineering），微调，也靠向量数据库来优化，AI落地并不是只靠单点技术就能够搞定的。

One More Thing

为了加深理解，有几个用饺子来解释“技术名词”的有趣比喻：

向量数据是干什么的？

谭老师我跟向量数据库说，我喜欢吃荤饺子，不喜欢吃素饺子。

向量数据库收到我的指示，开始准备食材，根据口味偏好，向量数据库所选食材可能有新鲜猪肉，五香牛肉，水晶虾仁等等食材。因为用向量进行模糊查询，以上食材都属于选择范围之内的馅料。

线上模型服务这种产品怎么理解？

谭老师我爱吃饺子，嫌麻烦不愿意自己包。但又是个挑剔的食客，偏要吃我家特有的饺子馅包成的饺子。我理想中的餐厅应有这样的服务：直接拎着饺子馅来餐馆，坐等。

后面的安排，包饺子，煮饺子，端饺子，都由餐厅来服务，除了饺子馅，我自己带，其余的餐厅服务（模型服务）全包。

好了，这次聊到这里。

更多内容参考这个公众号

里面的这篇文章（前方高能，几乎全英文）：

Earning Sage: How to Transform AI into a Savvy CFO

带货ing

《我看见了风暴》谭老师新书，京东有售

更多阅读

AI大模型与ChatGPT系列：

1. ChatGPT大火，如何成立一家AIGC公司，然后搞钱？

2. ChatGPT：绝不欺负文科生

3. ChatGPT触类旁通的学习能力如何而来？

4. 独家丨从大神Alex Smola与李沐离职AWS创业融资顺利，回看ChatGPT大模型时代“底层武器”演进

5. 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将

6. ChatGPT大模型用于刑侦破案只能是虚构故事吗？

7. 大模型“云上经济”之权力游戏

8. 云从科技从容大模型：大模型和AI平台什么关系？为什么造行业大模型？

9. 深聊第四范式陈雨强丨如何用AI大模型打开万亿规模传统软件市场？

10. 深聊京东科技何晓冬丨一场九年前的“出发”：奠基多模态，逐鹿大模型

11. 老店迎新客：向量数据库选型与押注中，没人告诉你的那些事

12.抢滩大模型，抢单公有云，Databricks和Snowflake用了哪些“阳谋”？

13.大模型“搅局”，数据湖，数据仓库，湖仓选型会先淘汰谁？

AI大模型与学术论文系列：

1.开源“模仿”ChatGPT，居然效果行？UC伯克利论文，劝退，还是前进？

2. 深聊王金桥丨紫东太初：造一个国产大模型，需用多少篇高质量论文？（二）

3. 深聊张家俊丨 “紫东太初”大模型背后有哪些值得细读的论文（一）

漫画系列

1. 是喜，还是悲？AI竟帮我们把Office破活干完了

2. AI算法是兄弟，AI运维不是兄弟吗？

3. 大数据的社交牛气症是怎么得的？

4. AI for Science这事，到底“科学不科学”？

5. 想帮数学家，AI算老几？

6. 给王心凌打Call的，原来是神奇的智能湖仓

7. 原来，知识图谱是“找关系”的摇钱树？

8. 为什么图计算能正面硬刚黑色产业薅羊毛？

9. AutoML：攒钱买个“调参侠机器人”？

10. AutoML：你爱吃的火锅底料，是机器人自动进货

11. 强化学习：人工智能下象棋，走一步，能看几步？

12. 时序数据库：好险，差一点没挤进工业制造的高端局

13. 主动学习：人工智能居然被PUA了？

14. 云计算Serverless：一支穿云箭，千军万马来相见

15. 数据中心网络：数据还有5纳秒抵达战场

16. 数据中心网络：迟到不可怕，可怕的是别人都没迟到

AI框架系列：

1.搞深度学习框架的那帮人，不是疯子，就是骗子（一）

2.搞AI框架那帮人丨燎原火，贾扬清（二）

3.搞 AI 框架那帮人（三）：狂热的 AlphaFold 和沉默的中国科学家

4.搞 AI 框架那帮人（四）：AI 框架前传，大数据系统往事

注：（三）和（四）仅收录于《我看见了风暴》。

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
深入理解LangChain中的Callback机制：如何为Runnable添加回调函数 aehrutktrjk langchain python
深入理解LangChain中的Callback机制：如何为Runnable添加回调函数引言在LangChain中，回调（Callbacks）是一种强大的机制，允许开发者在运行过程中监控和干预各种操作。本文将深入探讨如何为Runnable对象添加回调函数，这对于调试、日志记录和性能监控等任务至关重要。我们将通过实际的代码示例来演示这一过程，并讨论一些常见的应用场景和最佳实践。理解Callback机制
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
使用 LangChain 和 Neo4j 构建智能图数据库查询系统 aehrutktrjk langchain neo4j 数据库 python
使用LangChain和Neo4j构建智能图数据库查询系统引言在本文中，我们将探讨如何结合LangChain和Neo4j图数据库来构建一个智能的图数据库查询系统。这个系统能够将用户的自然语言问题转换为准确的Cypher查询，并生成易于理解的回答。我们将重点关注如何通过实体映射来提高查询的准确性，这对于处理复杂的图数据尤为重要。主要内容1.环境设置首先，我们需要安装必要的包并设置环境变量：#安装必要
报错 | pydantic.v1.error_wrappers.ValidationError ... subclass of BaseModel expected 程序猿林仔报错 python python langchain
文章目录01问题情景02分析问题03阅读源码04解决方案4.1方案1-指定版本安装4.2（通用）方案2-指定v1版本4.3（推荐）方案3-参考源码01问题情景最近在做Langchain的开发，可能是因为我更新了依赖库的版本，在执行下面这部分代码的时候出现了该异常：#出现该异常的代码(仅保留核心逻辑)fromlangchain.output_parsersimportPydanticOutputPa
基于 LangChain 开发应用程序第三章-储存明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分之前的章节可以查看基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出第三章储存在与语言模型交互时，你可能已经注意到一个关键问题：它们并不记忆你之前的交流内容，这在我们构建一些应用程序（如聊天机器人）的时候，带来了很大的挑战，使得对
使用LangChain与Together AI模型交互：深入探讨和实践指南 llzwxh888 langchain 人工智能交互 python
使用LangChain与TogetherAI模型交互：深入探讨和实践指南1.引言在人工智能和自然语言处理领域，TogetherAI已经成为一个强大的平台，提供了对50多个领先开源模型的访问。本文将深入探讨如何使用LangChain与TogetherAI模型进行交互，为开发者提供实用的知识和见解，同时解决可能遇到的常见问题。2.TogetherAI简介TogetherAI是一个强大的API平台，允许
MongoDB Atlas与LangChain集成指南 afTFODguAKBF mongodb langchain 数据库 python
引言MongoDBAtlas是一款全托管的云数据库解决方案,可在AWS、Azure和GCP上使用。最新版本支持在MongoDB文档数据上进行原生向量搜索。本文将介绍如何使用LangChain将MongoDBAtlas与语言模型集成,以实现高效的向量搜索和语义缓存。安装和设置1.安装langchain-mongodb包pipinstalllangchain-mongodb向量存储LangChain提
使用HTMLSectionSplitter进行智能HTML文档分割 afTFODguAKBF html python 前端
使用HTMLSectionSplitter进行智能HTML文档分割引言在处理大型HTML文档时，将其分割成更小的、语义相关的部分是一个常见需求。这不仅有助于提高文本处理的效率，还能保持文档的结构和上下文信息。本文将介绍LangChain库中的HTMLSectionSplitter，这是一个强大的工具，可以根据HTML结构智能地分割文档。HTMLSectionSplitter简介HTMLSectio
使用Fleet AI Context和LangChain构建高效的文档检索系统 afTFODguAKBF 人工智能 langchain python
使用FleetAIContext和LangChain构建高效的文档检索系统引言在当今的AI和机器学习领域，高质量的文档检索系统对于提高开发效率和用户体验至关重要。本文将介绍如何利用FleetAIContext提供的高质量embeddings和LangChain框架来构建一个强大的文档检索系统。我们将深入探讨如何处理嵌入向量、检索相关文档，以及如何将这些功能整合到一个简单但功能强大的代码生成链中。主
使用Fireworks API和LangChain构建高效的AI应用 afTFODguAKBF langchain 人工智能 easyui python
使用FireworksAPI和LangChain构建高效的AI应用引言在当今快速发展的AI领域，能够快速、高效地构建和部署AI应用变得越来越重要。FireworksAI提供了强大的API服务，而LangChain则是一个灵活的框架，可以帮助开发者更容易地构建基于大语言模型的应用。本文将介绍如何结合FireworksAPI和LangChain来创建高效的AI应用，并提供实用的代码示例和最佳实践。Fi
llm-universe学习小记录4--构建RAG应用 Adela0546 学习语言模型
构建RAG应用一、将LLM接入LangChain1、基于LangChain调用ChatGPT2、使用LangChain调用百度文心一言3、使用LangChain调用讯飞星火4、使用LangChain调用智谱GLM具体内容与代码详见将LLM接入LangChain。二、构建检索问答链1、加载向量数据库2、创建一个LLM3、构建检索问答链4、检索问答链效果测试5、添加历史对话的记忆功能（1）记忆（Mem
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人海哥python AI langchain python 机器人
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
第3篇：LangChain的架构总览与设计理念 Gemini技术窝 langchain 架构大数据人工智能 AIGC nlp
LangChain库是一个专为自然语言处理（NLP）设计的强大工具包，致力于简化复杂语言模型链的构建和执行。在本文中，我们将深入解析LangChain库的架构，详细列出其核心组件、设计理念及其在不同场景中的应用，并讨论其优缺点。文章目录1.LangChain库简介2.核心组件2.1数据输入模块作用2.2数据预处理模块作用2.3数据增强模块作用2.4数据加载与批处理模块作用2.5模型训练模块作用2.
LangChain框架详解大霸王龙 langchain python python langchain
LangChain框架详解LangChain是一个基于语言模型开发应用程序的强大框架，旨在帮助开发人员简化与大模型交互、数据检索以及将不同功能模块串联起来以完成复杂任务的过程。它提供了一套丰富的工具、组件和接口，使开发人员能够轻松构建上下文感知和具备逻辑推理能力的应用程序。以下是对LangChain框架的详细介绍，包括其定义、架构、主要模块、应用场景以及安装和使用方法。一、LangChain定义与
洞悉LangChain：LangChain工程化设计，从API到智能Agent的全面探索汀、人工智能 AI Agent LLM技术汇总 langchain 人工智能自然语言处理大模型 Agent LangGraph AI Agent
洞悉LangChain：LangChain工程化设计，从API到智能Agent的全面探索1.LangChain简介LangChain是2022年10月底，由哈佛大学的HarrisonChase发起的基于开源大语言模型的AI工程开发框架。当然也可以问一下AI：通义千问2.5：LangChain是一个开源框架，专注于简化开发者利用大型语言模型（LLM）创建应用程序的过程。这些大型语言模型，如GPT-3
基于Langchain的大模型RAG技术介绍（附示例代码）赵放-AI AI langchain 人工智能 chatgpt python
一、RAG简介在大模型技术的迅速发展下，涌现了各种庞大的模型，形成了一场所谓的‘百模大战’。这些模型在大小和性能上各有所长，但大多数都是在通用语料库上进行训练的，因此它们只具备通用知识，对于专业领域的知识了解较少。由于训练大模型的成本颇高，许多专业领域难以负担这一费用，但专业人士又希望利用大模型的强大能力解决专业问题。为解决这一问题，出现了两种技术路线：一种是通过使用专业领域的数据集微调通用大模型
RAG 聊天机器人：用 Langchain 和 Streamlit开启与 PDF 的智能对话 Soyoger 大模型应用落地架构实战机器人 langchain pdf 大数据 chatgpt
与大量PDF文档的交互如今变得前所未有地便捷与智能。想象一下，您可以轻松与您的笔记、书籍和各种文档进行无缝对话，不再需要繁琐的手动查找和处理。这篇文章将带您逐步构建一个基于Multi-RAG和Streamlit的Web应用程序，该应用程序通过AI驱动的聊天机器人来读取、解析和处理PDF数据，提供前所未有的用户体验。让我们一起深入探讨开发这一创新应用的完整过程，了解如何通过先进技术实现高效的文档管理
【LangChain】使用LangChain的提示词模板：技巧与总结子夜时辰 LangChain的学习 langchain javascript node.js AIGC chatgpt
作者简介：前端开发爱好者，致力学习前端开发技术⭐️个人主页：夜宵饽饽的主页❔系列专栏：JavaScript小贴士学习格言：成功不是终点，失败也并非末日，最重要的是继续前进的勇气前言：这里是关于LangChain框架中的提示词模板使用的技巧，希望可以帮助到大家，欢迎大家的补充和纠正文章目录一、使用LangChain的提示词模板：技巧与总结1、格式化示例集2、示例选择器来组合提示词模板3、在聊天模型中
【AI大模型应用开发】【LangChain系列】9. 实用技巧：大模型的流式输出在 OpenAI 和 LangChain 中的使用同学小张大模型人工智能 langchain gpt 笔记经验分享 agi
大家好，我是同学小张，日常分享AI知识和实战案例欢迎点赞+关注，持续学习，持续干货输出。+v:jasper_8017一起交流，一起进步。微信公众号也可搜【同学小张】本站文章一览：当大模型的返回文字非常多时，返回完整的结果会耗费比较长的时间。如果等待大模型形成完整的答案再展示给用户，明显会给用户不好的体验。所以，现在市面上大多数的AI应用，在给用户结果时，都是以流式输出的方式展示给用户的。所谓的流式
llm在网页中的流式输出（langchain与streamlit库）格瑞Lxf langchain
一、手动进行流式输出llm本身是支持在终端流式输出的，以ollama为例llm=Ollama(base_url="http://localhost:11434",model="qwen",callback_manager=CallbackManager([StreamingStdOutCallbackHandler()]),)查看源码StreamingStdOutCallbackHandler类中
大模型LLM面试常见算法题-包括Attention和Transformer常见面试题剑圣土豆算法面试大模型学习自然语言处理 transformer 算法 nlp 自然语言处理面试深度学习人工智能
大模型：位置编码有哪些？介绍LoRA与QLoRARAG和微调的区别是什么？哪些因素会导致LLM的偏见？什么是思维链（CoT）提示？Tokenizer的实现方法及原理解释一下大模型的涌现能力？解释langchainAgent的概念langchain有哪些替代方案？RLHF完整训练过程是什么？为什么RLHF的效果这么好?RLHF使用的训练数据是什么样的?RAG和微调的区别是什么？有了解过什么是稀疏微调
Langchain + Ollama AI工程仔 LLM &AIGC langchain ollama rag
文章目录方式一：Ollama运行起来后，使用langchain加载fromlangchain.llmsimportOllamaollama=Ollama(base_url='http://localhost:11434',model="llama2")print(ollama("whyistheskyblue"))方式二：使用langchain_community1、下载Ollama:https:
使用 RecursiveUrlLoader 实现递归网页爬取：深入解析与实践指南 qq_37836323 python 前端数据库
使用RecursiveUrlLoader实现递归网页爬取：深入解析与实践指南1.引言在当今的数字时代，网络爬虫已成为获取和分析大量在线信息的重要工具。LangChain提供的RecursiveUrlLoader是一个强大的工具，能够递归地爬取网页内容，并将其转换为易于处理的文档格式。本文将深入探讨RecursiveUrlLoader的使用方法、特性以及实际应用场景。2.RecursiveUrlLo
langchain `as_retriever` 方法大多_C langchain java 服务器
as_retriever方法是一个用于将VectorStore对象转换为VectorStoreRetriever对象的便捷方法。VectorStoreRetriever是一个检索类，用于从向量存储中查找和检索最相关的文档。这个方法接受多个可选参数来配置检索的行为。用法介绍参数search_type(Optional[str]):定义检索器应该执行的搜索类型。选项包括："similarity":默认
Ollama教程——深入解析：使用LangChain和Ollama构建JavaScript问答系统 walkskyer ollama入门教程 langchain javascript 开发语言 ollama AI
ollama入门系列教程简介与目录相关文章:Ollama教程——入门：开启本地大型语言模型开发之旅Ollama教程——模型：如何将模型高效导入到Ollama框架Ollama教程——兼容OpenAIAPI：高效利用兼容OpenAI的API进行AI项目开发Ollama教程——使用LangChain：Ollama与LangChain的强强联合Ollama教程——生成内容API：利用Ollama的原生AP
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

美国大模型风向速报（一）为何重视提示工程？LangChain+向量数据库+开源大模型真香...

你可能感兴趣的:(langchain)