小草cys

GPT垂直领域相关模型现有的开源领域大模型

对于ToC端来说，广大群众的口味已经被ChatGPT给养叼了，市场基本上被ChatGPT吃的干干净净。虽然国内大厂在紧追不舍，但目前绝大多数都还在实行内测机制，大概率是不会广泛开放的（毕竟，各大厂还是主盯ToB、ToG市场的，从华为在WAIC的汇报就可以看出）。而对于ToB和ToG端来说，本地化部署、领域or行业内效果绝群、国产化无疑就成为了重要的考核指标。

个人觉得垂直领域大模型或者说大模型领域化、行业化才是大模型落地的核心要素。恰好前几天ChatLaw（一款法律领域大模型产品）也是大火，当时也是拿到了一手内测资格测试了一阵，也跟该模型的作者聊了很久。正好利用周末的时间，好好思考、梳理、汇总了一些垂直领域大模型内容。

文章内容将从ChatLaw展开、到垂直领域大模型的一些讨论、最后汇总一下现有的开源领域大模型。

聊聊对ChatLaw的看法

ChatLaw的出现，让我更加肯定未来大模型落地需要具有领域特性。相较于目前领域大模型，ChatLaw不仅仅是一个模型，而是一个经过设计的大模型领域产品，已经在法律领域具有很好的产品形态。

Paper: https://arxiv.org/pdf/2306.16092.pdf

Github: https://github.com/PKU-YuanGroup/ChatLaw官网: https://www.chatlaw.cloud/

可能会有一些质疑，比如：不就是一个langchain吗？法律领域它能保证事实性问题吗？等等等。但，我觉得在否定一件事物的前提，是先去更深地了解它。

ChatLaw共存在两种模式：普通模型和专业模型。普通模式就是仅基于大模型进行问答。

而专业模式是借助检索的手段，对用户查询进行匹配从知识库中筛选出合适的证据，再根据大模型汇总能力，得到最终答案。

由于专业模式，借助了知识库的内容，也会使得用户得到的效果更加精准。而在专业版中，ChatLaw制定了一整套流程，如上图所示，存在反问提示进行信息补全，用户信息确认、相似案例检索、建议汇总等。

作者@JessyTsui（知乎）也说过，其实ChatLaw=ChatLaw LLM + keyword LLM + laws LLM。而keyword LLM真的让我眼前一亮的，之前对关键词抽取的理解，一直是从文本中找到正确的词语，在传统检索中使用同义词等方法来提高检索效果。而keyword LLM利用大模型生成关键词，不仅可以找到文本中的重点内容，还可以总结并释义出一些词。使得整个产品在检索证据内容时，效果更加出色。

同时，由于不同模型对不同类型问题解决效果并不相同，所以在真正使用阶段，采用HuggingGPT作为调度器的方式，在每次用户请求的时候去选择调用更加适配的模型。也就是让适合的模型做更适合的事情。

聊聊对垂直领域大模型的看法

现在大模型的使用主要就是两种模型，第一种是仅利用大模型本身解决用户问题；第二种就是借助外部知识来解决用户问题。而我个人觉得是“借助外部知识进行问答”才是未来，虽然会对模型推理增加额外成本，但是外部知识是缓解模型幻觉的有效方法。

但随着通用大模型底层能力越来越强，以及可接受文本越来越长，在解决垂直领域问题时，完全可以采用ICL技术，来提升通用大模型在垂直领域上的效果，那么训练一个垂直领域大模型是否是一个伪命题，我们还有必要做吗？

个人认为是需要的，从几个方面来讨论：

1、个人觉得真正垂直领域大模型的做法，应该从Pre-Train做起。SFT只是激发原有大模型的能力，预训练才是真正知识灌输阶段，让模型真正学习领域数据知识，做到适配领域。但目前很多垂直领域大模型还停留在SFT阶段。
2、对于很多企业来说，领域大模型在某几个能力上绝群就可以了。难道我能源行业，还需要care模型诗写的如何吗？所以领域大模型在行业领域上效果是优于通用大模型即可，不需要“即要又要还要”。
3、不应某些垂直领域大模型效果不如ChatGPT，就否定垂直领域大模型。有没有想过一件可怕的事情，ChatGPT见的垂直领域数据，比你的领域大模型见的还多。但某些领域数据，ChatGPT还是见不到的。
4、考虑到部署成本得问题，我觉得在7B、13B两种规模的参数下，通用模型真地干不过领域模型。及时175B的领域大模型没有打过175B的通用模型又能怎么样呢？模型参数越大，需要数据量越大，领域可能真的没有那么多数据。

PS：很多非NLP算法人员对大模型产品落地往往会有一些疑问：

Q：我有很多的技术标准和领域文本数据，直接给你就能训练领域大模型了吧？

A：是也不是，纯文本只能用于模型的预训练，真正可以进行后续问答，需要的是指令数据。当然可以采用一些人工智能方法生成一些指数据，但为了保证事实性，还是需要进行人工校对的。高质量SFT数据，才是模型微调的关键。

Q：你用领域数据微调过的大模型，为什么不直接问答，还要用你的知识库？

A：外部知识主要是为了解决模型幻觉、提高模型回复准确。

Q：为什么两次回复结果不一样？

A：大模型一般为了保证多样性，解码常采用Top-P、Top-K解码，这种解码会导致生成结果不可控。如果直接采用贪婪解码，模型生成结果会是局部最优。

Q：我是不是用开源6B、7B模型自己训练一个模型就够了？

A：兄弟，没有训练过33B模型的人，永远只觉得13B就够了。

以上是个人的一些想法，以及一些常见问题的回复，不喜勿喷，欢迎讨论，毕竟每个人对每件事的看法都不同。

开源垂直领域大模型汇总

目前有很多的垂直领域大模型已经开源，主要在医疗、金融、法律、教育等领域，本小节主要进行「中文开源」模型的汇总及介绍。

「PS：一些领域大模型，如未开源不在该汇总范围内；并且欢迎大家留言，查缺补漏。」

医疗领域

非中文项目：BioMedLM、PMC-LLaMA、ChatDoctor、BioMedGPT等，在此不做介绍。

MedicalGPT-zh

Github: https://github.com/MediaBrain-SJTU/MedicalGPT-zh

简介：基于ChatGLM-6B指令微调的中文医疗通用模型。
数据：通过对16组诊疗情景和28个科室医用指南借助ChatGPT构造182k条数据。数据也已开源。
训练方法：基于ChatGLM-6B，采用Lora&16bit方法进行模型训练。

DoctorGLM

Github: https://github.com/xionghonglin/DoctorGLM

简介：一个基于ChatGLM-6B的中文问诊模型。
数据：主要采用CMD（Chinese Medical Dialogue Data）数据。
训练方法：基于ChatGLM-6B模型，采用Lora和P-tuning-v2两种方法进行模型训练。

PS：数据来自Chinese-medical-dialogue-data项目。

Huatuo-Llama-Med-Chinese

Github: https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

简介：本草（原名：华驼-HuaTuo）: 基于中文医学知识的LLaMA微调模型。
数据：通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集，数据共开源9k条。
训练方法：基于Llama-7B模型，采用Lora方法进行模型训练。

Med-ChatGLM

Github: https://github.com/SCIR-HI/Med-ChatGLM

简介：基于中文医学知识的ChatGLM模型微调，与本草为兄弟项目。
数据：与Huatuo-Llama-Med-Chinese相同。
训练方法：基于ChatGLM-6B模型，采用Lora方法进行模型训练。

ChatMed

Github: https://github.com/michael-wzhu/ChatMed

简介：中文医疗大模型，善于在线回答患者/用户的日常医疗相关问题.
数据：50w+在线问诊+ChatGPT回复作为训练集。
训练方法：基于Llama-7B模型，采用Lora方法进行模型训练。

ShenNong-TCM-LLM

Github: https://github.com/michael-wzhu/ShenNong-TCM-LLM

简介：“神农”大模型，首个中医药中文大模型，与ChatMed为兄弟项目。
数据：以中医药知识图谱为基础，采用以实体为中心的自指令方法，调用ChatGPT得到11w+的围绕中医药的指令数据。
训练方法：基于Llama-7B模型，采用Lora方法进行模型训练。

BianQue

Github: https://github.com/scutcyr/BianQue

简介：扁鹊，中文医疗对话模型。
数据：结合当前开源的中文医疗问答数据集（MedDialog-CN、IMCS-V2、CHIP-MDCFNPC、MedDG、cMedQA2、Chinese-medical-dialogue-data），分析其中的单轮/多轮特性以及医生问询特性，结合实验室长期自建的生活空间健康对话大数据，构建了千万级别规模的扁鹊健康大数据BianQueCorpus。
训练方法：扁鹊-1.0以ChatYuan-large-v2作为底座模型全量参数训练得来，扁鹊-2.0以ChatGLM-6B作为底座模型全量参数训练得来。

SoulChat

Github: https://github.com/scutcyr/SoulChat

简介：中文领域心理健康对话大模型，与BianQue为兄弟项目。
数据：构建了超过15万规模的单轮长文本心理咨询指令数据，并利用ChatGPT与GPT4，生成总共约100万轮次的多轮回答数据。
训练方法：基于ChatGLM-6B模型，采用全量参数微调方法进行模型训练。

法律领域

LaWGPT

Github: https://github.com/pengxiao-song/LaWGPT

简介：基于中文法律知识的大语言模型。
数据：基于中文裁判文书网公开法律文书数据、司法考试数据等数据集展开，利用Stanford_alpaca、self-instruct方式生成对话问答数据，利用知识引导的数据生成，引入ChatGPT清洗数据，辅助构造高质量数据集。
训练方法：（1）Legal-Base-7B模型：法律基座模型，使用50w中文裁判文书数据二次预训练。（2）LaWGPT-7B-beta1.0模型：法律对话模型，构造30w高质量法律问答数据集基于Legal-Base-7B指令精调。（3）LaWGPT-7B-alpha模型：在Chinese-LLaMA-7B的基础上直接构造30w法律问答数据集指令精调。（4）LaWGPT-7B-beta1.1模型：法律对话模型，构造35w高质量法律问答数据集基于Chinese-alpaca-plus-7B指令精调。

ChatLaw

Github: https://github.com/PKU-YuanGroup/ChatLaw

简介：中文法律大模型
数据：主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成，随后经过清洗、数据增强等来构造对话数据。
训练方法：（1）ChatLaw-13B：基于姜子牙Ziya-LLaMA-13B-v1模型采用Lora方式训练而来。（2）ChatLaw-33B：基于Anima-33B采用Lora方式训练而来。

LexiLaw

Github: https://github.com/CSHaitao/LexiLaw

简介：中文法律大模型
数据：BELLE-1.5M通用数据、LawGPT项目中52k单轮问答数据和92k带有法律依据的情景问答数据、Lawyer LLaMA项目中法考数据和法律指令微调数据、华律网20k高质量问答数据、百度知道收集的36k条法律问答数据、法律法规、法律参考书籍、法律文书。
训练方法：基于ChatGLM-6B模型，采用Freeze、Lora、P-Tuning-V2三种方法进行模型训练。

LAW-GPT

Github: https://github.com/LiuHC0428/LAW-GPT

简介：中文法律大模型（獬豸）
数据：现有的法律问答数据集和基于法条和真实案例指导的self-Instruct构建的高质量法律文本问答数据。
训练方法：基于ChatGLM-6B，采用Lora&16bit方法进行模型训练。

lawyer-llama

Github: https://github.com/AndrewZhe/lawyer-llama

简介：中文法律LLaMA
数据：法考数据7k、法律咨询数据14k
训练方法：以Chinese-LLaMA-13B为底座，未经过法律语料continual training，使用通用instruction和法律instruction进行SFT。

金融领域

非中文较好的项目：BloombergGPT、PIXIU等，在此不做介绍。

FinGPT

Github: https://github.com/AI4Finance-Foundation/FinGPT

简介：金融大模型
数据：来自东方财富
训练方法：基于ChatGLM-6B，采用Lora方法训练模型。

FinTuo

Github: https://github.com/qiyuan-chen/FinTuo-Chinese-Finance-LLM

简介：一个中文金融大模型项目，旨在提供开箱即用且易于拓展的金融领域大模型工具链。
数据：暂未完成。
训练方法：暂未完成。

教育领域

EduChat

Github: https://github.com/icalk-nlp/EduChat

简介：以预训练大模型为基底的教育对话大模型相关技术，提供教育场景下自动出题、作业批改、情感支持、课程辅导、高考咨询等丰富功能，服务于广大老师、学生和家长群体，助力实现因材施教、公平公正、富有温度的智能教育。
数据：混合多个开源中英指令、对话数据，并去重后得到，约400w。
训练方法：基于LLaMA模型训练而来。

LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
LLM-生成器判别器的实现
总结首先，使用GPT模型获取每个词的生成概率pLLMp_{LLM}pLLM。然后，使用训练好的生成判别器，对每个可能的生成结果进行打分，得到pθ(c∣x1:t)p_\theta(c|x_{1:t})pθ(c∣x1:t)。最后，结合两者的输出，用贝叶斯规则调整每个词的概率，选择调整后的概率最高的词作为输出。通过这样的组合，生成过程可以更好地满足预期需求，如生成符合特定风格或格式的文本。要在使用已经预
Xcode 26 现已发布，并支持代码智能它与基于 Cursor 和 AI Agent 的工作流程相比如何？知识大胖 SwiftUI源码大全 xcode macos ide
简介Xcode26昨天发布了！惊喜的是，它支持macOS15，但要使用新的ChatGPT助手，你需要macOS26Tahoe。所以我把我的M3MaxMacBookPro升级到了Tahoe。我不是说你应该升级，但我这么做是为了测试Xcode的新功能并与大家分享！值得注意的是，这是迄今为止最小的Xcode版本（下载大小）！正如Apple在Xcode新功能会话视频（我建议您观看）中所说的那样，这是一项巨
12 个强大的 DeepSeek AI 提示将彻底改变您的日常生活知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
内容写作的最佳提示让我们从写作开始吧。无论您是博主、学生还是社交媒体创作者，这些提示都将帮助您创作出精彩的内容。提示1：“扮演专业文案撰稿人，为[产品/服务]撰写引人注目的广告文案。文案应引人入胜、具有说服力，且字数不得超过100个字。”这使得ChatGPT的响应结构就像真实的广告文案一样。提示2：“以更具吸引力和说服力的方式重写此段落，同时保持含义不变：[插入文本]。”推荐文章《Neo4j上使用
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
本地部署大模型的几种方式 AI产品经理语言模型人工智能自然语言处理 chatgpt 学习
现在大模型可谓是满天飞,只要你稍微关注时下的AI资讯,几乎每天都有新的AI大模型出现.这之中当然有诸如GhatGPT,Gemini这样的私有化大模型,更吸引人关注的可能是开源的可私有化部署的一些大模型.比如Meta前两天开放的Lamma3,Google的Gemma开源模型,国内也有Qwen以及YI等.前排提示，文末有大模型AGI-CSDN独家资料包哦！无论私有的大模型,还是开源的可私有化部署的大模
低成本作弊神器？使用ESP32将通义千问AI接入学生计算器
前因：IT之家9月24日消息，YouTube频道ChromaLock于9天前发布视频，介绍了名为TI-32的改造电路板，加装在德州仪器TI-84Plus图形计算器上，可以接入ChatGPT。IT之家查询公开资料，在PSAT、SAT和ACT大学入学考试、IB和AP考试中，标准化组织已经批准考生使用TI-84Plus图形计算器。ChromaLock探索了该计算器的连接端口，设计了名为TI-32的改造电
在LLM快速迭代时代构建持久AI应用：架构设计与实施策略
引言：技术浪潮下的开发困境大型语言模型(LLM)的发展速度令人瞠目：从GPT-3到GPT-4，从Claude1到Claude3，从Llama1到Llama3，迭代周期正在从"年"缩短到"月"。作为一名AI应用开发者，我亲身经历了这种技术浪潮带来的挑战：昨天精心调优的prompt今天可能失效；上个季度集成的模型这个季度已有更优选择；刚完成的功能设计瞬间被新模型的能力超越。在如此快速变化的环境中，如何
AI Agent 2025 大爆发：从 GPT-4o 到 Devin，下一代 Agent 架构与落地趋势深度解析
当大模型学会“看”“听”“点鼠标”，并且还能叫来一整个“Agent舰队”协同工作，软件开发、运营乃至个人生产力的游戏规则正在被重写。1|为什么Agent在2025重新引爆？模型升级带来实时多模态OpenAIGPT-4o把文本、语音、图像三路感知和毫秒级响应塞进同一模型，实时demo像“科幻电影走出屏幕”OpenAI。浏览器级自动操作新上线的OperatorAgent能在Web页面自主点击、滚动、填
ChatGPT 技术核心：模型结构、能力差异与实战价值
ChatGPT系列模型全景与版本进化按时间与技术路标排序，核心模型如下：GPT‑3.5（2022）GPT‑4（2023年3月）GPT‑4Turbo/GPT‑4.5（2023年末/2025年2月）GPT‑4o（Omni）（2024年5月）GPT‑4o mini/o1/o3系列/GPT‑4.1（2024–2025）每一代都是对前代提升版本，从参数规模、性能、能力上不断优化。核心技术差异详解（面向高级程
chatgpt赋能python：Python音频降噪处理：使用Python减少噪音并提升声音质量
Python音频降噪处理：使用Python减少噪音并提升声音质量在日常生活中，使用音频通信是非常普遍的。但是，由于各种原因，我们可能会遇到许多噪音干扰，从而降低语音质量并影响通信的效果。为了解决这个问题，我们可以使用Python来降噪音。什么是音频降噪处理？我们每天听到的声音都是由许多不同频率的声音波形组成的。噪音是指在声音中添加了其他频率的声音波形。这些声音可以是来自电器的嗡嗡声、风扇或其他背景
chatgpt赋能python：Python降噪技术突出人声，在语音处理中的应用 atest166 ChatGpt chatgpt python 语音识别计算机
Python降噪技术突出人声，在语音处理中的应用在现代社会中，语音处理已经成为了一个普遍的技术，由于环境干扰和录音设备的限制，录音中往往会有许多杂音和噪音，影响语音质量和信号分析。在此背景下，降噪技术逐渐成为了一项重要的技术手段。Python作为一门功能强大的编程语言，可以被广泛地应用于语音处理，尤其是在降噪方面。在本篇文章中，我们会详细探讨Python降噪技术突出人声的应用。什么是语音降噪？语音
大模型微服务架构：拆解AI应用的资源密码陈乔布斯大模型 AI 人工智能人工智能架构微服务 AI 大模型 python API
引言：为什么大模型应用需要微服务架构？想象你经营一家网红餐厅，刚开始只有一个厨师负责所有菜品（类似单体架构）。随着生意火爆，顾客需要川菜、粤菜、甜品等多种选择，单个厨师忙不过来，还经常出错。于是你招聘了川菜师傅、粤菜师傅、甜品师，每人专注一个领域（类似微服务架构），效率和质量立刻提升——这就是大模型应用从单体架构转向微服务的核心原因。随着ChatGPT、文心一言等大模型技术的爆发，互联网企业正将大
【零基础学AI】第36讲：GPT模型原理 1989 0基础学AI 人工智能 gpt lstm rnn YOLO 目标检测
本节课你将学到理解GPT模型的基本原理掌握Transformer解码器的工作机制实现一个简单的文本生成应用开始之前环境要求Python3.8+安装包：pipinstalltransformerstorch硬件：CPU即可运行（GPU可加速）前置知识了解基本的神经网络概念（第23讲内容）熟悉Python编程基础核心概念什么是GPT？GPT（GenerativePre-trainedTransform
大模型 Agent（智能体）技术简介北京地铁1号线自然语言处理与大语言模型大模型语言模型 Agent
大模型Agent（智能体）技术是当前人工智能领域的前沿方向，它赋予大型语言模型（LLM）自主感知、规划、决策和行动的能力，使其不再局限于“被动应答”，而是能主动完成复杂任务。简单来说，Agent是一个以LLM为“大脑”的自主智能系统，能够理解目标、使用工具、与环境交互并最终解决问题。一、为什么需要Agent？——大模型的局限与Agent的使命传统的大语言模型（如GPT-4、Claude、Llama
Embabel：下一代企业级JVM AI智能体框架的革命引言：AI时代的Java生态新机遇 DZSpace 软件开发 jvm 人工智能 java
在生成式AI（如ChatGPT、Claude、Gemini）席卷全球的背景下，Python凭借其丰富的AI工具链（如PyTorch、LangChain）成为主流开发语言。然而，在企业级软件开发领域，Java和JVM生态（如Kotlin、Scala）长期以来占据主导地位，尤其是在金融、电信、电商等对稳定性、可扩展性、事务管理要求极高的场景。RodJohnson（Spring框架创始人）敏锐地发现了这
Building Apps with AI Tools: ChatGPT, Semantic Kernel, and Langchain 项目推荐滕娴殉
BuildingAppswithAITools:ChatGPT,SemanticKernel,andLangchain项目推荐building-apps-with-ai-tools-chatgpt-semantic-kernel-langchain-4469616ThisisacoderepositoryfortheLinkedInLearningcourseBuildingAppswithAIT
AI让我焦虑，可有解药？大虫小呓人工智能 AIGC
被AI相关的信息搞焦虑了？这波以生成式人工智能为核心的生产力变革浪潮，从23年开始短短的两年时间里一浪接一浪的奔涌而来，从ChatGPT、AGI，到多模态大模型、Agent、Cursor，到DeepSeek、Manus，到近期的MCP协议、A2A协议等各种新概念、应用或工具的信息接连不断的往我们的脑子冲进来。就像被连续扇耳光，上一个还没反应过来下一个又来了，被扇得脑袋瓜子嗡嗡的！我发现一个普遍的现
FastGPT私有化部署完整指南小雷FansUnion AI2025 FastGPT 大模型 AI平台
FastGPT私有化部署完整指南环境要求硬件要求最低配置:CPU:4核内存:8GB存储:50GB网络:稳定互联网连接推荐配置:CPU:8核+内存:16GB+存储:100GB+SSD网络:10Mbps+带宽软件环境必需软件:-Docker:>=20.10.0-DockerCompose:>=2.0.0-Git:最新版本操作系统:-Ubuntu20.04+(推荐)-CentOS7+-WindowsSe
ChatGPTNextChat项目重构计划（九）：NextChat 解析API路由处理逻辑 stream.ts
大模型落地开发实战指南！请关注微信公众号：「AGI启程号」深入浅出，助你轻松入门！数据分析、深度学习、大模型与算法的综合进阶，尽在CSDN博客主页目录一、文件作用概述二、导入模块与类型定义三、核心函数详细解析`fetch(url,options)`四、`fetch`函数详细步骤解析步骤1:检测Tauri环境并准备请求参数步骤2:创建数据流(`TransformStream`)步骤3:定义关闭数据流
专题：2025大模型2.0：GPT到DeepSeek技术演进与产业落地报告|附200+份报告PDF汇总下载拓端研究室 pdf
原文链接：https://tecdat.cn/?p=42738当OpenAI在2023年推出ChatGPT时，业界或许未曾预料到，短短两年后大模型会以“2.0”形态重塑产业逻辑。本报告汇总解读基于国家工业信息安全发展研究中心与联想集团联合发布的《2025大模型2.0产业发展报告》，以及哈工大计算学部人工智能学院关于DeepSeek系列模型的技术白皮书，深入剖析大模型从“技术验证”向“商业落地”跃迁
从AI辅助编码到自动部署：前端开发提效全流程实践程序猿全栈の董（董翔）人工智能热门技术领域人工智能新兴领域热门技术
从AI辅助编码到自动部署：前端开发提效全流程实践**摘要本文结合ChatGPT、GitHubCopilot等AI工具，分享从需求分析、代码编写到自动化部署的全流程提效技巧。通过真实案例演示如何利用AI工具提升30%以上的开发效率，适合有一定前端基础的开发者阅读。一、引言：AI时代的前端开发变革现状：据StackOverflow2023调查，65%的开发者使用AI辅助工具，平均减少35%的调试时间。
Prompt相关伤心美眉 prompt
目录Prompt设计基础一.推理模型（例如gpt-4o，能够快速反应）二.通用模型Prompt相关一.AI需求类型二.Prompt类型三AI幻觉写Prompt技能一.基本技能二.基本策略三常见陷阱四如何写好一个Prompt1.基本模型：2.提示语链应用场景一文案写作二营销策划：三品牌故事Prompt设计基础一.推理模型（例如gpt-4o，能够快速反应）1.能够进行数学推导，逻辑分析，代码生成，复杂
Spring AI 教程（一）概述 PG Thinker Spring AI Spring ChatGPT 人工智能 spring java Spring AI
前言我在23年11月那会儿关注了SpringAI项目，当时我恰好正热衷于大语言模型的开发，然而当时主流的开发语言只有Python，Java生态中并没有强大的框架供我们使用。我当时也是靠一些封装OpenAI接口的SDK包来玩ChatGPT的，但是整体的体验较差。好在我通过一些技术交流群了解了一个正在处于实验阶段的项目：SpringAI。于是果断前往它的Github仓库进行学习，而我也恰好见证了S
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

GPT垂直领域相关模型 现有的开源领域大模型