dzysunshine

HuatuoGPT模型介绍

文章目录

HuatuoGPT 模型介绍
LLM4Med（医疗大模型）的作用
ChatGPT 存在的问题
HuatuoGPT的特点
ChatGPT 与真实医生的区别
解决方案
- 用于SFT阶段的混合数据
- 基于AI反馈的RL
评估
- 单轮问答
- 多轮问答
- 人工评估

HuatuoGPT 模型介绍

HuatuoGPT（华佗GPT）是香港中文大学（深圳）和深圳市大数据研究院的王本友教授团队训练并开源了一个新的医疗大模型，以使语言模型具备像医生一样的诊断能力和提供有用信息的能力。

论文地址：https://arxiv.org/pdf/2305.15075.pdf
github 地址：https://github.com/FreedomIntelligence/HuatuoGPT
Demo 地址：https://www.huatuogpt.cn/

HuatuoGPT的核心是在监督微调阶段利用来自ChatGPT的提取数据和来自医生的真实世界数据。ChatGPT的回答虽然具有流畅性和全面性，但它在一些方面不能像医生一样表现，例如在综合诊断方面。作者认为，可以在SFT阶段将来自医生的真实数据将与来自ChatGPT的提取数据进行互补，而为了更好地利用两种数据的优势，作者训练了一个奖励模型，以使语言模型与两种数据带来的优点保持一致，并遵循RLAIF（从人工智能反馈中强化学习）。

LLM4Med（医疗大模型）的作用

LLM4Med的预期目的是医疗和健康建议、分诊、诊断、开药、解释医疗报告等。一般来说，任何医疗或健康信息都可以合并到在线聊天过程中，类似于使用ChatGPT。在线医疗咨询提供了许多优势，包括：

成本效益：以在线方式为多个用户服务的成本与为单个用户服务的成本不成线性比例。一旦对模型进行了训练，这种可扩展性就可以实现经济高效的扩展。
减少医院拥挤：最近的疫情凸显了医院人满为患的风险，因为许多人即使不需要立即就医也会寻求线下咨询。通过提供在线替代方案，可以缓解医院的压力，以减轻未来流行病的风险。
解决心理障碍：一些人可能因为恐惧或迷信而不寻求医疗帮助或治疗。在线聊天平台可以为这些人提供一个更舒适的环境来讨论他们的担忧。
医疗平等：中国的医疗保健不平等是一个重大问题。一线城市居民与小城市和农村地区居民在医疗条件方面的差异非常显著。

ChatGPT 存在的问题

虽然 ChatGPT对一些非垂直领域的问题的回答通常是流畅和全面的，但在医疗领域存在以下问题：

ChatGPT在医学领域表现不佳，尤其是在中文领域；
ChatGPT因道德和安全问题拒绝诊断和开药；
ChatGPT的表现不如医生，例如，它从不提问，即使患者的情况不完整，医生通常会询问更多细节。在这种情况下，ChatGPT会给出一个通用的响应，而不是专门的响应。

HuatuoGPT的特点

HuatuoGPT是第一个使用RLAIF来利用真实数据和提取数据（包括指令和会话数据）的优点的医学语言模型。
人类评估显示，HuatuoGPT优于现有的开源LLM和ChatGPT（GPT-3.5-turbo）。其性能与医生最相似。

ChatGPT 与真实医生的区别

下图为ChatGPT 与医生回复的区别。

医疗咨询中ChatGPT回复(左)和医生回复(右)的示例对话，将文本从中文翻译成英文。图中蓝色表示的是医生们提出的问题，下划线表示的是医学诊断。可以看出，ChatGPT通常不会提出问题以回应病人或像医生一样提供医疗诊断。且ChatGPT回复的数据的质量可能会有波动，表现为生成的对话中的不正确或模棱两可的信息。

ChatGPT的回复：在医疗领域，大规模语言模型（LLM）具有广阔的应用潜力。尽管像 ChatGPT 这样的语言模型能够生成内容详实、表述流畅、逻辑清晰的回复，但其在回应患者描述症状时，缺乏专业性和对患者输入的精确解读。其回复常常包含多种可能性，并以较高层次的建议形式呈现，但往往缺少深入的上下文理解能力，使得其帮助患者的具体情况有限。

真实医生的回复：相比之下，现实世界中医生与患者的互动数据能够更准确地反映医疗情景的复杂性，并提供准确无误的诊断建议，具有极高的专业性。然而，由于时间的限制，医生的回应常常简洁至不能充分传达信息，甚至有时会显得不连贯。若仅依靠这些数据来训练模型，得到的模型难以流畅地应对多样的指令或对话，其生成的回应也会显得短小、表述不佳，有时信息含糊，这对患者并不友好。

论文提出的语言模型训练方法结合了医生和 ChatGPT 的数据，充分发挥它们的互补作用，既保留真实医疗数据的专业性和准确性，又借助 ChatGPT 的多样性和内容丰富性的特点。

解决方案

流行的医学模型中数据源和训练方法的比较。

HuatuoGPT 的示意图

从上图可以看出，HuatuoGPT侧重于整合医生和ChatGPT的特征，通过两阶段训练策略提高医疗咨询中的反应质量：混合数据的SFT和人工智能反馈的RL。首先利用精心选择的混合数据（包含提取的指令数据和对话数据，以及真实的指令数据和对话数据），通过监督微调来训练模型，然后通过人工智能的反馈来加强所需响应的生成。使得最终得到的模型具有四个特点：类似医生，对患者友好，指令跟踪和交互式诊断。

用于SFT阶段的混合数据

从ChatGPT提取指令数据：遵循self-instruct的工作构建了一组医疗指导数据，旨在使模型能够遵循用户的医疗指导。不同之处在于，采用了自上而下的方式来创造更自然、更全面的应对措施。作者设计了一个分类法来收集或手动创建基于角色和用例的种子指令。根据每个角色或用例，使用自我指导分别生成指令。这可以提供广泛的说明，同时为每个角色或用例保留足够的说明。最后，将所有的种子指令混合在一起，进行自我指导；这可能有助于生成更加多样化的指令。

从医生获取真实世界指令：真实世界的指令数据来源于医生和患者之间的问答。医生的回答是专业知识，具有高度的相关性和简洁性。因此，通过提炼真实的医患QA对，进一步提高了single-turn指令数据的质量和可靠性。

从ChatGPT获取对话：提取的对话由两个ChatGPT生成，每个ChatGPT使用精心设计的提示与一个角色（医生或患者）进行关联。首先，利用第三方医学诊断数据库作为生成合成对话数据的医学知识和专业知识的来源。基于患者的基本背景和医生的最终诊断，两个ChatGPT被要求逐一生成对话。在这些对话中，LLM产生的回答通常信息丰富、详细、呈现良好，并遵循一致的风格；格式和信息通常对患者友好。

从医生获得真实世界对话：真实世界的对话是从真实的场景中收集的，医生的反应通常需要不同的能力，包括长期推理和提出问题来指导患者描述自己的症状。然而，这种数据有时过于简洁和口语化。为了解决这一问题，作者利用语言模型来增强和细化基于原始内容的数据，从而生成高质量的真实对话数据集。

通过以上四种方式生成的数据如下：

基于AI反馈的RL

在监督微调（SFT）阶段，作者引入了一个多样化的数据集，旨在使HuatuoGPT能够模仿医生的询问和诊断策略，同时保持LLM反应的丰富、逻辑和连贯特征。为了进一步使模型的生成偏好与人类需求相一致，建议将强化学习与人工智能反馈相结合，以提高模型响应（response）的质量。此前，OpenAI引入了带有人类反馈的强化学习，以使LLM与人类偏好保持一致，但需要付出大量的时间和人力成本。作者设计了一个新的奖励模型，以迫使模型在不偏离医生诊断的情况下生成信息和逻辑响应。

奖励模型的构建

使用真实的指令和对话作为训练数据，从微调的模型中采样多个响应。对于多回合对话，提供对话历史，以调整模型的响应生成。然后，这些response由LLM（如ChatGPT）进行评分，考虑到信息性、连贯性、对人类偏好的遵守以及基于给定真实医生诊断的事实准确性。评分LLM评估每个响应并分配一个分数。使用这些成对的响应数据来训练奖励模型，使用微调模型作为其主干，以更好地泛化。

在RL过程中，通过对当前策略 $\pi$ 对给定query $x$ 的 $k$ 个不同response $\left\{y_1, \ldots, y_k\right\}$ 进行采样。每个response $y_i$ 被送到奖励模型以得到奖励分数 $r_{R M}$ 。为了确保模型不会偏离初始状态 $\pi_0$ 太远，作者添加了经验估计的KL惩罚项，最终的奖励函数如下： $r=r_{R M}-\lambda_{K L} D_{K L}\left(\pi \| \pi_0\right)$ 其中 $\lambda_{K L}$ 是KL惩罚的超参数， $D_{K L}$ 是KL函数。 $\lambda_{K L}$ 通常设置为0.05。输入查询被消除重复并从剩余的SFT混合数据中采样。这确保了输入的多样性，同时在单轮指令和多轮对话场景中都保留了模型的response偏好。

评估

在评估 HuatuoGPT 的性能表现上，团队成员采用了自动评估和人工评估两种方式相互验证，在单轮问答场景和多轮交互式诊断场景中分别进行了评估。

单轮问答

针对单轮问答场景，团队成员精心收集了涵盖 10 个医疗领域意图的 100 个问题，并利用 GPT-4 进行自动评估。具体来说，团队提供了两个模型对同一问题生成回复，并使用 GPT-4 对每个模型的回复进行分析和打分。最终的测试结果显示，相较于基于 LLaMa 和 ChatGLM 的开源中文医疗模型，HuatuoGPT 表现显著优秀（以 HuatuoGPT 为基准）。这一优势得益于 HuatuoGPT 同时使用了从 ChatGPT 蒸馏的数据和真实世界数据进行训练，并借助来自 ChatGPT 和专业医生的混合反馈进行了优化。

多轮问答

对于多轮问诊场景，团队成员收集了涵盖 20 个科室的 100 个多轮对话进行了评估。评估结果显示，HuatuoGPT 不仅全面优于目前的开源中文医疗模型，而且在大部分科室的表现上均优于 GPT-3.5-turbo，这为 HuatuoGPT 在处理更加复杂的多轮问诊场景中的优异性能提供了有力的证据。

人工评估

在人工评估方面，团队成员使用了自动评估中的样本进行评估验证。团队成员邀请专业医生为模型的输出结果进行人工评估。下表是单轮问答场景和多轮诊断场景的评估结果。评估结果表明，无论是单轮的人工评测还是多轮的人工评测结果都与自动评估的结果保持了一致，这充分验证了模型性能评估的一致性和可靠性。

单轮对话

多轮对话

你可能感兴趣的:(ChatGPT,chatgpt)

用LangChain构建自愈式生成式AI：颠覆传统知识库的智能问答系统实战煜bart 机器人人工智能 python AI编程
引言：当生成式AI遇到自进化架构ChatGPT的惊艳表现让企业意识到生成式AI的潜力，但传统问答系统仍面临数据孤岛、知识更新滞后等痛点。本文将揭秘如何通过LangChain框架构建具有自进化能力的智能问答系统，实现企业知识库的实时动态更新与智能推理。通过本文，您将掌握一套让AI系统在运行中持续学习、自主优化的创新架构。---##一、核心技术突破###1.1自愈式数据管道（Self-healingP
Manus详细介绍 accurater c++算法笔记深度学习人工智能神经网络
第一章Manus的技术背景与核心突破初识ManusAI1.1什么是Manus？Manus是由中国团队Monica.im于2025年3月推出的全球首款通用型AI智能体（AIAgent）。其名称源自拉丁语“MensetManus”，意为“手脑并用”，强调将大模型的逻辑推理能力转化为实际生产力。与传统的对话式AI（如ChatGPT、DeepSeek）不同，Manus的核心定位是“执行型助手”，能够自主完
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
chatgpt赋能python：Python处理雷达基数据：从入门到实践 lvsetongdao123 ChatGpt python chatgpt 开发语言计算机
Python处理雷达基数据：从入门到实践随着气象技术的不断发展，雷达探测技术已成为当今天气预报和气象研究的主要手段之一。雷达基数据是气象雷达接收到的未经加工的原始数据，因其包含大量天气信息，不仅在天气预报、天气预警等方面得到了广泛应用，还被广泛地用于气象科研和大气环境研究。本文将介绍如何使用Python处理雷达基数据，解析其中的信息，获取有效的天气数据，以及分析和可视化这些数据。雷达基数据格式与处
AI：对比ChatGPT这类聊天机器人，人形机器人对人类有哪些不一样的影响？ InnoLink_1024 AGI 人工智能机器学习 chatgpt 人工智能机器人
人形机器人与像ChatGPT这样的聊天机器人相比，虽然都属于人工智能技术的应用，但由于其具备的物理形态和与环境的互动能力，它们对人类的影响会有很大的不同。下面从多个角度进行对比，阐述它们各自对人类的不同影响：1.物理交互与虚拟交互人形机器人：具有物理形态，能够在物理世界中与人类进行直接交互。例如，搬运物品、进行日常家务、提供身体上的帮助（如扶持老人、帮助走路等），以及进行非语言的沟通（如手势、面部
AI生成视频是什么，效果如何，影响哪些行业？程序员小麦人工智能 AI作画
有个读者深夜问了我一个问题，让我思考了一个深夜。一年前，我写过一篇文章叫《我可能要给鼓吹AI的那些人，浇盆凉水了》。当时ChatGPT很火，整个网络都把AI吹上了天。我则唱反调，因为我就处在这个行业的底层，可谓知冷知热。不过，我当时并没有否定AI，只是表达AI并没有传说的那般无敌，谈不上让各行各业纷纷失业。首先，AI的门槛很高，基本是头部企业的专属，距离普通大众还是很远。另外，通用模型想要落地，必
【ChatGPT】如何选择不同版本的Java 南天归鴻 java
下面提供一份综合多方专业平台（如Oracle、InfoWorld、DZone、AdoptOpenJDK、RedHat等）信息整理的Java版本推荐报告，数据截止至2025年3月18日。下文将对“最新版本”、“稳定的最新版本”、“最稳定的版本”以及“市面上最常用的版本”进行详细对比，并从版本特性、优势、劣势、学习/实验需求、企业生产需求、兼容性与安全性等角度进行分析，供各类用户参考。一、背景说明Ja
微服务 vs 单体架构：你应该选择哪种模式？测试者家园 IT求职面试测试开发和测试质量效能架构微服务云原生智能化测试软件测试人工智能质量效能
用ChatGPT做软件测试软件架构从来都不只是技术选型，更是对企业战略、团队能力和业务模型的深刻反映。微服务和单体架构之争，表面上是技术模式的对比，实则映射着对复杂性管理、敏捷响应和可持续发展的不同认知与选择。今天，当“云原生”、“容器化”、“分布式”成为行业热词，微服务被推上了神坛。然而，单体架构真的过时了吗？微服务就注定是未来的唯一解法吗？如果你仍然在为“选择哪种架构”而困惑，这篇文章将带你跳
自建智能算力中心 vs 第三方算力租赁：AI企业的算力博弈与最优解
人工智能的爆发式增长正在重塑全球产业格局。从ChatGPT到DeepSeek，从自动驾驶到智能医疗，AI模型的训练和推理需求呈现指数级增长。在这场技术革命中，算力已成为企业竞争的“命脉”。然而，面对动辄数亿元的硬件投入和复杂的运维挑战，AI企业正面临一个关键抉择：自建智能算力中心，还是选择第三方算力租赁？本文将从成本、效率、风险及适用场景等维度展开深度分析，为企业提供决策参考。一、成本对比：重资产
ChatGPT + Vue3：如何打造 AI 智能助手？ Js_x chatgpt 人工智能
引言人工智能（AI）正快速渗透到前端开发领域，越来越多的开发者希望将ChatGPT集成到自己的应用中，为用户提供智能对话、自动回复、辅助决策等功能。本文将介绍如何使用Vue3+OpenAIAPI搭建一个AI智能助手，让你的应用拥有强大的AI交互能力。1.项目准备1.1技术栈选择本项目将使用以下技术：Vue3-现代化的前端框架，响应式强，适合构建交互式应用。Vite-高效的Vue3项目构建工具，提升
用 AI 提高开发效率：自动生成代码、优化 SQL 查询、写测试用例 Js_x 人工智能 sql 测试用例
引言人工智能（AI）正在深刻改变软件开发行业。从代码自动补全到SQL查询优化，再到自动化测试，AI工具已经成为开发者提高生产力的重要助手。本文将介绍ChatGPT、GitHubCopilot、Tabnine等AI编程工具的实际应用，帮助开发者更高效地编写代码、优化数据库查询，并自动生成测试用例。1.AI代码生成：提升开发效率1.1ChatGPT代码生成ChatGPT具备强大的自然语言处理能力，可以
vue对接openai_实现ChatGPT 开心小老虎 vue3知识点+组件 chatgpt
一、openai密钥使用API密钥才能连接到OpenAIAPI，去OpenAI网站注册一个账户（目前国内访问openai受限制，需要其他方式进行访问），单击个人资料图片和“查看API密钥”，创建一个新的密钥。openai官网https://openai.com/二、使用openai包发送请求获得数据1.下载openai包npmiopenai--save2.使用openai包发送请求importOp
7招教你掌握用DeepSeek辅助论文写作的提示词技巧学境思源AcademicIdeas 学境思源 AI写作 ChatGPT 人工智能
随着人工智能技术的快速发展，大模型（如DeepSeek、ChatGPT等）已经成为论文写作的重要辅助工具。合理运用提示词（Prompt），不仅能极大提高写作效率，还能辅助生成高质量的学术内容。今天的内容将分享如何利用DeepSeek的提示词技巧，助力论文写作。1.明确写作目标，让AI理解你的需求在使用大模型时，清晰的写作目标至关重要。一个好的提示词应当包括：写作主题、内容范围、格式要求、风格倾向等
超全！600 个通用大模型Prompt指令 AI Echoes 人工智能
超全！600个ChatGPT通用Prompt指令：1.电子邮件营销提示“我需要一种[电子邮件类型]，让我的[理想客户角色]对我的[产品/服务]产生[情感]，并说服他们以紧迫感采取[期望的行动]。”“我正在寻找一种[电子邮件类型]，它可以直接说明我的[理想客户角色]的需求和痛点，并以紧迫感和强烈的提议说服他们采取[期望的行动]。”“我需要一封[电子邮件类型]，向[理想的客户角色]展示我的[产品/服务
【Python学习笔记】一些关于多线程，xls文件读取，PyQt5，PyInstaller打包等问题的解决方案记录百里香酚兰 Python自学笔记 python 学习笔记 pyinstaller xls文件 PyQt5 多线程
背景：最近利用休息时间写了个小型exe程序，主要涉及的技术点有：多线程，读取xls文件，基于PyQt5的简单GUI页面，利用PyInstaller打包成exe。虽然有ChatGPT等协助，但难免还是在开发过程中遇到了一些疑难问题，所以开个记录贴刊登解决方式。问题&解决方式：1.PyQt+PyInstaller：tqdm报错AttributeError:‘NoneType‘objecthasnoat
2025年2月值得收藏的国内可用的免费AI大语言模型平台评测 chatgptdeepseek
作为开发者和AI爱好者，我一直在寻找便捷可靠的大语言模型服务。今天整理分享几个我亲自体验过的、国内可访问的AI对话平台，希望能为大家节省筛选时间。为什么需要替代方案？由于众所周知的原因，直接访问原版ChatGPT存在一定障碍。虽然有VPN等解决方案，但对于日常使用而言，一个稳定、便捷的国内可用平台能大幅提升工作效率。几个值得尝试的平台GPT中文站(https://chat.uniation.net
Secs/Gem第一讲 · 总结精华版(基于secs4net项目的ChatGpt介绍) 好学近乎知o secs/gem 面试 secs4net
好的！这就是《第一讲·总结精华版》——为背诵准备的口述速成稿，适合面试前复习+答题用。我们会分为两个部分：第一部分：一整段口述稿，可以当成面试时开口自我介绍用；第二部分：要点清单+关键词串讲，方便你临阵复盘，条理更清晰。【第一部分】通用口述稿（面试时可复读）“我们在对接设备时主要使用SECS/GEM通信协议，它是半导体行业里的一个国际标准，基于SECS-II报文格式和HSMS或SECS-I物理层。
作为普通程序员，我们该如何学习大模型（LLM），学习路线和知识体系和老莫一起学AI 学习人工智能深度学习语言模型 ai 程序员转行
前言原谅我的后知后觉，才开始从头写，我是已经上了一阶段大模型的课，也搜集了些资料，并自己做了小部分实践，回过头来，才想开始整理些文章。起初，大家都在写，都在发，我那会在焦虑。自chatgpt爆火以来，AI技术又被广泛关注，国内外各大厂商也纷纷布局，作为我们每一个普通人，也无不时刻感受着AI一波又一波的冲击。尤其是作为程序员的我，相信绝大多数程序员也有和我一样的感受，从一开始的新奇，到焦虑，到试图去
探索DeepSeek：前端开发者不可错过的新一代AI技术实践指南 formerlyai 人工智能前端
引言：为什么DeepSeek成为技术圈焦点？最近，国产AI模型DeepSeek凭借其低成本训练、高性能输出和开源策略，迅速成为开发者社区的热门话题。作为覆盖语言、代码、视觉的多模态技术矩阵，DeepSeek不仅实现了与ChatGPT相媲美的能力，还通过强化学习驱动的架构创新，解决了大模型落地中的成本与效率瓶颈。对于前端开发者而言，DeepSeek的API接入能力和私有化部署方案，为智能应用开发提供
从“参数竞赛”到“行动革命”：Manus与DeepSeek背后的中国AI范式之争 AWS官方合作商人工智能 AI deepseek Manus
引言：当中国AI开始定义游戏规则在OpenAI用ChatGPT掀起全球AI浪潮的两年后，中国科技企业正以两种截然不同的姿势重新书写竞争剧本——DeepSeek用671亿参数的R1模型震撼硅谷，而Manus则以“数字打工人”的姿态突破AI代理的想象边界。这不仅是技术的较量，更是中国AI产业对西方话语体系的颠覆性回应。本文将用技术现实主义视角，解剖这场“参数狂魔”与“行动派”的角力真相一、DeepSe
ChatGPT推理模型&通用模型大解析！即兴小索奇 ChatGPT&AI 人工智能 chatgpt
很多人知道通用模型和推理模型了，那么ChatGPT的哪些模型是通用模型，哪些又是推理模型呢？以下是ChatGPT的所有模型及其分类介绍：通用模型GPT-4：OpenAI的旗舰模型，是一个大型多模态模型，能够比以前的模型更准确地解决困难问题，具有更广泛的通用知识和先进的推理能力。它适用于多种任务，包括聊天、文本生成、内容创作等。GPT-4o系列：包括GPT-4o、GPT-4owithCanvas、G
【源码阅读】olmocr中的prompts 海绵波波107 #大模型 pdf
目录一、PDF转换为训练数据二、使用微调模型三、比较差异总结一、PDF转换为训练数据让ChatGPT-4将文档（如PDF文件）转换为结构化的“银级”训练数据（silvertrainingdata）#Thisisthepromptweuseforgettingchatgpt4otoconvertdocumentsintooursilvertrainingdatadefbuild_openai_sil
大模型联网搜索组件 SearXNG 部署和使用「已注销」
SearXNG是一个免费的互联网元搜索引擎，它整合了来自超过70个搜索服务的结果。用户不会被跟踪或进行特征分析，很好地保护了用户隐私。2022年11月OpenAI发布ChatGPT后，大模型和知识库开始火爆，联网搜索成为弥补大模型知识陈旧的重要工具。提供元搜索功能的SearXNG开始被很多大模型应用比如ChatNio[1]采用，在大模型时代发挥了巨大作用。本文将介绍如何基于docker部署私人的S
ChatGPT智能聊天机器人实现云端源想 chatgpt 机器人
以下是一个从零实现类ChatGPT智能聊天机器人的完整开发指南，包含技术选型、核心代码逻辑和推荐学习资源：—云端平台整理一、技术架构与工具核心模型基座模型：HuggingFaceTransformers库（如GPT-2/GPT-3.5TurboAPI/LLaMA2）轻量化方案：微软DeepSpeed或MetaFairScale（降低显存占用）训练框架PyTorchLightning+Acceler
ChatGPT、DeepSeek、Grok 三者对比：AI 语言模型的博弈与未来一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能技术的飞速发展，AI语言模型已经成为人机交互、内容创作、代码生成、智能问答等领域的重要工具。其中，ChatGPT（OpenAI）、DeepSeek（中国团队研发）和Grok（xAI，ElonMusk旗下公司）是当前三大具有代表性的AI语言模型。它们在技术架构、应用场景、用户体验、生态开放性等多个维度各具特色，并针对不同的用户需
为什么转行大模型行业？深度解析职业变革与技术红利大模型入门教程大模型学习语言模型人工智能 AI 大模型程序员大模型入门
引言2023年ChatGPT的爆发式发展，标志着AI大模型技术正式进入大众视野。这一技术不仅重塑了人工智能的边界，更催生了全新的职业赛道。从传统算法工程师到互联网从业者，越来越多的人开始将目光投向大模型领域。本文将深入探讨这一现象背后的核心动因，并结合行业现状、技术趋势与职业发展路径，为从业者提供系统性分析。一、行业变革：传统岗位萎缩与大模型崛起传统技术岗位的困境以推荐算法为例，随着移动互联网流量
Google Gemini 大模型技术架构剖析 musicml 人工智能
▼最近直播超级多，预约保你有收获近期直播：《从原理到实践教你做出一个Gemini/ChatGPT》—1—Gemini技术架构剖析Google新的多模态模型家族Gemini，它在文本、图像、音频、视频等方面具有卓越的能力。Gemini系列包括Ultra、Pro和Nano三种尺寸，适用于从复杂的推理任务到设备内存受限的应用场景。GeminiUltra是最强大的模型，可在各种高度复杂的任务（包括推理和多
精选AI大模型读物：《从ChatGPT到AIGC：智能创作与应用赋能》——探索智能时代的创作力量 AGI大模型老王人工智能 chatgpt AIGC AI大模型大模型
自2023年以来，AI聊天机器人ChatGPT火爆互联网，其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术―AIGC也引起了互联网圈的关注，打开了人们对AI应用的想象空间。本书从ChatGPT入手，以AIGC为中心，对AIGC的理论知识、应用场景、未来发展等内容进行了全面的梳理。首先，本书对AIGC的概念、技术构成、产业生态、市场现状等进行了讲解，以便读者对AIGC形成一个清
深入解析两大AI模型的架构与功能草莓屁屁我不吃人工智能 chatgpt
在人工智能（AI）领域，自然语言处理（NLP）一直是研究的热点之一。随着技术的不断进步，我们见证了从简单的聊天机器人到复杂语言模型的演变。其中，Google的Gemini和OpenAI的ChatGPT作为两大代表性模型，各自在技术和应用上展现出了卓越的性能。本文将详细解析Gemini和ChatGPT的系统架构、功能特性及其背后的技术原理。Gemini模型详解技术背景与架构Gemini，顾名思义，意
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他