快乐小码农

一文详解 ChatGPT：背后的技术，数据，未来发展

文章目录

一文详解 ChatGPT
- ChatGPT背后的技术
- - 基于 Transformer 的预训练语言模型
  - 提示学习与指令精调
  - 思维链（Chain of Thought，COT）
  - 基于人类反馈的强化学习（Reinforcement Learning with Human Feedback，RLHF）
- ChatGPT 相关数据集
- - 预训练数据集
  - 人工标注数据规范及相关数据集
- 如何看待ChatGPT的未来发展？
- - OpenAI 指出 ChatGPT 的现存
  - ChatGPT 的优势
  - ChatGPT 的劣势
  - ChatGPT 应用前景

一文详解 ChatGPT

从2022年11月30日ChatGPT出现至今，热议不断，ChatGPT在全世界点燃了新一轮AI革命，海内外关注度陡增，越来越多“关联”企业跟风而上，科技“狠话”、科技“狠活”真真假假，让人一时分不清到底谁是谁非。

ChatGPT 能表现出惊艳的语言理解、生成、知识推理能力，这得益于自然语言处理（NLP）的发展。而从NLP技术发展看，如下图1.1，可以发现：每一个技术阶段的发展时间，大概是上一个阶段的一半。

小规模专家知识发展了 40 年，浅层机器学习是 20 年，之后深度学习大概 10 年，预训练语言模型发展的时间是 5 年，那么以 ChatGPT 为代表的技术能持续多久呢？如果大胆预测，可能是 2 到 3 年，也就是到 2025 年大概又要更新换代了。

ChatGPT背后的技术

ChatGPT 核心技术主要包括其具有良好的自然语言生成能力的大模型 GPT-3.5 以及训练这一模型的钥匙——基于人工反馈的强化学习（RLHF）。

ChatGPT 的卓越表现得益于其背后多项核心算法的支持和配合，包括作为其实现基础的 Transformer 模型、激发出其所蕴含知识的 Prompt/Instruction Tuning 算法、其涌现出的思维链（COT）能力、以及确保其与人类意图对齐的基于人类反馈的强化学习（RLHF）算法。

基于 Transformer 的预训练语言模型

ChatGPT 强大的基础模型采用 Transformer 架构， Transformer 是一种基于自注意力机制的深度神经网络模型，可以高效并行地处理序列数据。原始的Transformer 模型包含两个关键组件：编码器和解码器。在原始 Transformer 模型基础上，相继衍生出了三类预训练语言模型：编码预训练语言模型、解码预训练语言模型和编解码预训练语言模型。

	编码预训练语言模型（Encoder-only Pre-trained Models）	解码预训练语言模型（Decoder-only Pre-trained Models）	基于编解码架构的预训练语言模型（Encoder-decoder Pretrained Models）
模型特点	这类模型在预训练过程中只利用原始 Transformer 模型中的编码器。相应的预训练任务通常选用掩码语言建模任务（Masked Language Modeling），即掩码住（用特殊字符 [MASK] 替换）输入句子中一定比例的单词后，要求模型根据上下文信息去预测被遮掩的单词。	GPT (Generative Pre-trained Transformer) 是由 OpenAI 提出的只有解码器的预训练模型。相较于之前的模型，不再需要对于每个任务采取不同的模型架构，而是用一个取得了优异泛化能力的模型，去针对性地对下游任务进行微调。	针对单一编码器或解码器出现的问题，一些模型采用序列到序列的架构来融合两种结构，即基于编解码架构的预训练语言模型，使用编码器提取出输入中有用的表示，来辅助并约束解码器的生成。
代表模型	BERT，ALBERT，RoBERTa	GPT-1，GPT-2 ，GPT-3	BART，T5，Switch Transformers，
不足	基于编码器的架构得益于双向编码的全局可见性，在语言理解的相关任务上性能卓越（在NLU表现更好），但是因为无法进行可变长度的生成，不能应用于生成任务。	基于解码器的架构采用单向自回归模式，可以完成生成任务（在NLG表现更好），但是信息只能从左到右单向流动，模型只知“上文”而不知“下文”，缺乏双向交互。	与单个编码器/解码器相比，编码器-解码器引入了更多的参数。虽可通过参数共享来缓解，但其参数效率仍然值得怀疑。编码器-解码器架构通常在自然语言理解（NLU）方面表现不佳。

提示学习与指令精调

提示学习（Prompt Learning）是一个NLP界最近兴起的学科，能够通过在输入中添加一个提示词（Prompt），使得预训练模型的性能大幅提高。Prompt Tuning和Fine Tuning都是对预训练模型进行微调的方法。

提出Prompt的动机是，语言模型（Language Models）越来越大，Fine-tune的成本也越来越高。Fine-tuning的本质是改变预训练模型的weights。LM有基于大量训练数据的天然的迁移学习能力，但要在新域上获得较好的性能，使用Fine-tuning，就要求重新多次训练预训练模型，导致吃内存。

提示学习（Prompt Learning）是指对输入文本信息按照特定模板进行处理，把任务重构成一个更能充分利用预训练语言模型处理的形式。

比如，假如我要判断“我喜欢这个电影" 这句话的情感（“正面" 或者 “负面”），原有的任务形式是把他看成一个分类问题
输入：我喜欢这个电影
输出：“正面" 或者 “负面”
而用Prompt Learning去解决的话，任务可以变成“完形填空"，
输入：我喜欢这个电影，整体上来看，这是一个 __ 的电影
输出：“有趣的" 或者 “无聊的”

总结一下，使用Prompt的根本方法是：
自然语言指令（task description） + 任务demo（example） + 带"__"的任务。

Prompt Tuning的本质是改变任务格式，从而迎合大模型的性能。换句话说，Prompt Tuning的前提是预训练模型的性能已经非常好了，我们只需要在推断的时候进行任务格式转换即可获得很好的性能。下面这张图很好地表达了这个本质：

一句话总结，Fine-tuning，是调整语言模型，让任务和语言模型靠的更近；Prompt Tuning，是调整任务格式，让任务和语言模型靠的更近。

相较于提示学习（Prompt Learning），指令精调（Instruction Tuning）可以说是提示学习的加强版。

例如，给你2个任务：
1.我带女朋友去了一家餐厅，她吃的很开心，这家餐厅太 __ 了！
2.判断这句话的情感：我带女朋友去了一家餐厅，她吃的很开心。选项：A=好，B=一般，C=差

在这两个任务中，Prompt就是第一种模式，Instruction就是第二种。

两种学习方法的本质目标均是希望通过编辑输入来深挖模型自身所蕴含的潜在知识，进而更好的完成下游任务。

Instruction Tuning 和Prompt Learning的本质目标是一样的，通过编辑输入来深挖模型自身所蕴含的潜在知识，进而更好的完成下游任务。而他们的不同点就在于，Prompt是去激发语言模型的补全能力，比如给出上半句生成下半句、或者做完形填空，都还是像在做language model任务，它的模版是这样的：

而Instruction Tuning则是激发语言模型的理解能力，通过给出更明显的指令/指示，让模型去理解并做出正确的action。比如NLI/分类任务：

研究表明，当“指令”任务的种类达到一定量级后，大模型甚至可以在没有见过的零样本（Zero-shot）任务上有较好的处理能力。因此，指令学习可以帮助语言模型训练更深层次的语言理解能力，以及处理各种不同任务的零样本学习能力。 OpenAI提出的InstructGPT 模型使用的就是指令学习的思想， ChatGPT 沿袭了InstructGPT 的方法。

思维链（Chain of Thought，COT）

人类在解决数学应用题这类复杂推理任务的过程中，通常会将问题分解为多个中间步骤，并逐步求解，进而给出最终的答案。受此启发，谷歌研究人员 Jason Wei（现 OpenAI 员工）等提出了思维链（Chain of Thought，COT），通过在小样本提示学习的示例中插入一系列中间推理步骤，有效提升了大规模语言模型的推理能力，图 2.2展示模型通过产生思维链来正确求解数学应用题。

相较于一般的小样本提示学习，思维链提示学习有几个吸引人的性质：

在思维链的加持下，模型可以将需要进行多步推理的问题分解为一系列的中间步骤，这可以将额外的计算资源分配到需要推理的问题上。
思维链为模型的推理行为提供了一个可解释的窗口，使通过调试推理路径来探测黑盒语言模型成为了可能。
思维链推理应用广泛，不仅可以用于数学应用题求解、常识推理和符号操作等任务，而且可能适用任何需要通过语言解决的问题。
思维链使用方式非常简单，可以非常容易地融入语境学习（in-context learning），从而诱导大语言模型展现出推理能力。

基于人类反馈的强化学习（Reinforcement Learning with Human Feedback，RLHF）

RLHF 这一概念最早是在 2008 年 TAMER：Training an Agent Manually via Evaluative Reinforcement 一文中被提及的。

RLHF 是 ChatGPT/InstrcutGPT 实现与人类意图对齐，即按照人类指令尽可能生成无负面影响结果的重要技术。该算法在强化学习框架下实现，大体可分为以下两个阶段：奖励模型训练，生成策略优化。

根据OpenAI的思路，RLHF分为三步：1.预训练一个语言模型LM；2.收集数据并训练一个奖励模型；3.利用强化学习微调语言模型LM。

简单来说，这三步：

花钱招人给问题（prompt）写回答（demonstration），然后finetune一个GPT3。这一步可以多训几个版本，第二步会用到。

图注：第一步，预训练一个语言模型LM

用多个模型（可以是初始模型、finetune模型和人工等等）给出问题的多个回答，然后人工给这些问答对按一些标准（可读性、无害、正确性blabla）进行排序，训练一个奖励模型/偏好模型来打分（reward model）。
用强化学习训练上面那个finetune后的GPT3模型。用强化学习做LM训练的一种思路是用Policy Gradient做，这一块OpenAI用的是他们在17年提出的PPO算法，即Proximal Policy Optimization。

ChatGPT 相关数据集

算法、数据、算力是大模型时代的三方面重要因素。根据 OpenAI 前期论文和博客介绍， ChatGPT 中数据集的规模和构建质量均高于以往的人工标注数据集。

预训练数据集

ChatGPT 之所以展现出非常优秀的文本理解能力，其中重要的因素是其拥有一个强大的基座模型。为了获得这样基座模型，需要在大规模无标注文本数据上进行预训练，目前被广泛使用的预训练数据集主要包括 BooksCorpus、 Wikipedia、 Common Crawl、 ROOT 等，表 4.1概览了目前常用的预训练数据集，具体情况如下所示：

在对大模型做大规模评价之后，发现训练数据中含有代码的模型具有很强的语言推理能力。在对 OpenAI 的各个模型测试中，也发现代码预训练与 COT 表现息息相关。因此，在预训练时使用代码数据成为越来越多研究者的共识。代码预训练数据可以根据程序语言和自然语言是否同时出现分成单语数据和对齐数据。表格 4.2展示了一些常见数据集的基本信息。

人工标注数据规范及相关数据集

指令微调数据集通常建立在自然语言处理经典数据集基础上。 Google 研究院及 Hugging Face 等机构提出的指令微调训练任务采用的自然语言处理数据集如表4.4所示。表4.5为 InstructGPT 模型训练的部分测试集以及对模型能力提升的分析。

如何看待ChatGPT的未来发展？

虽然 ChatGPT 目前已经取得了非常喜人的成果，但是未来仍然有诸多可以研究的方向。

OpenAI 指出 ChatGPT 的现存

序号	ChatGPT现存问题	产生原因
1	ChatGPT 有时候会生成一些似是而非、毫无意义的答案。	（1）强化学习训练过程中没有明确的正确答案；（2）训练过程中一些谨慎的训练策略导致模型无法产生本应产生的正确回复；（3）监督学习训练过程中错误的引导导致模型更倾向于生成标注人员所知道的内容而不是模型真实知道的。
2	ChatGPT 对于输入措辞比较敏感，例如：给定一个特定的问题，模型声称不知道答案，但只要稍微改变措辞就可以生成正确答案。
3	ChatGPT 生成的回复通常过于冗长，并且存在过度使用某些短语的问题，例如：重申是由 OpenAI 训练的语言模型。	这样的问题主要来自于训练数据的偏差和过拟合问题。
4	虽然 OpenAI 已经努力让模型拒绝不恰当和有害的请求，但是仍然无法避免对有害请求作出回复或对问题表现出偏见。
5	ChatGPT 虽然很强大，但是其模型过于庞大使用成本过高，如何对模型进行瘦身。	目前主流的模型压缩方法有量化、剪枝、蒸馏和稀疏化等。

ChatGPT 的优势

相较于不同产品和范式，ChatGPT的优势有哪些？

优势比较	ChatGPT VS普通聊天机器人	ChatGPT VS 其它大规模语言模型	ChatGPT VS微调小模型
ChatGPT特点	ChatGPT 的回答更准确，答案更流畅，能进行更细致的推理，能完成更多的任务。	ChatGPT使用了更多的多轮对话数据进行指令微调，这使其拥有了建模对话历史的能力，能持续和用户交互。	ChatGPT通过大量指令激发的泛化能力在零样本和少样本场景下具有显著优势，在未见过的任务上也可以有所表现。
ChatGPT优势	（1）强大的底座能力；（2）惊艳的思维链推理能力；（3）实用的零样本能力。	（1）在Instruction Tuning阶段通过基于人类反馈的强化学习调整模型的输出偏好，使其能输出更符合人类预期的结果。（2）RLHF利用真实的用户反馈不断进行 AI 正循环，持续增强自身和人类的这种对齐能力，输出更安全的回复。	（1）大规模语言模型的天然优势使 ChatGPT 在创作型任务上的表现尤为突出。

ChatGPT 的劣势

比较方面	ChatGPT的劣势
大规模语言模型	（1）可信性无法保证；（2）时效性差；（3）成本高昂；（4）在特定的专业领域上表现欠佳；（5）语言模型每次的生成结果是 beam search 或者采样的产物，每次都会有细微的不同。ChatGPT 对输入敏感，回答不够稳定。
数据	（1）ChatGPT 的基础大规模语言模型是基于现实世界的语言数据预训练而成，因为数据的偏见性，很可能生成有害内容。（2）ChatGPT 为 OpenAI 部署，用户数据都为 OpenAI 所掌握，长期大规模使用可能存在数据泄漏风险。
标注策略	ChatGPT 通过基于人类反馈的强化学习使模型的生成结果更符合人类预期，然而这也导致了模型的行为和偏好一定程度上反映的是标注人员的偏好，在标注人员分布不均的情况下，可能会引入新的偏见问题。
使用场景	在目前微调小模型已经达到较好效果的前提下，ChatGPT的训练和部署更困难，有些任务场景下不太适用，性价比稍低。

ChatGPT 应用前景

ChatGPT 作为掀起新一轮 AIGC 热潮的新引擎，无论在人工智能行业还是其他行业都带来了广泛的讨论和影响。

领域/行业	ChatGPT应用	影响公司
人工智能行业	1.代码开发；2.ChatGPT 和具体任务相结合；3.ChatGPT 当作冷启动收集相关语料的工具。
搜索引擎	搜索引擎	谷歌：Bard，微软：文心一言，微软：新Bing
泛娱乐行业	游戏虚拟人，虚拟主播，虚拟数字人
自媒体行业	内容创作	Buzzfeed
教育行业	作业，论文，考试
日常办公	邮件，演讲稿，文案，报告	微软
其他专业领域	具体影响不大，无法对专业知识进行细致分析，生成的回答专业度不足且可信性难以保证

公众号回复「ChatGPT报告」获得90+页哈工大NLP内部《ChatGPT调研报告》。

参考：
https://new.qq.com/rain/a/20230311A06DWI00
https://huggingface.co/blog/rlhf

欢迎各位关注我的个人公众号：HsuDan，我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。

鸿蒙AI智能问答，助力开发者高效开发 harmonyos
随着鸿蒙生态的快速发展，开发者面临着技术迭代快、知识碎片化的双重挑战。传统开发模式中，开发者需在官网文档、论坛帖子、API参考间反复切换，频繁查阅文档，导致效率低下。与此同时，AI技术的爆发式发展为开发工具智能化提供了新方向。在此背景下，华为在6月21日举办的2025开发者大会（HDC2025）上正式上线了AI智能问答，以自然语言对话为核心交互方式，构建权威、实时、精准的鸿蒙开发知识中枢，重新定义
线性代数-第9篇：二次型与正定矩阵：优化问题的数学基础程序员勇哥人工智能(AI)线性代数人工智能大数据 python
线性代数-第9篇：二次型与正定矩阵：优化问题的数学基础在人工智能、量化投资和大数据分析中，优化问题无处不在，比如机器学习的损失函数最小化、量化投资组合的风险最小化等。而二次型与正定矩阵作为线性代数中的重要概念，为解决这些优化问题提供了坚实的数学基础。本篇将深入解析它们的原理及其在实际场景中的关键应用。一、二次型：从向量到函数的桥梁1.定义与表达式二次型是一个关于向量x\mathbf{x}x的二次齐
windows11 环境下Mamba 环境安装：causal-conv1d和mamba-ssm报错解决办法 lzdjlu 深度学习 python 人工智能 pytorch python
Mamba环境安装：causal-conv1d和mamba-ssm报错解决办法在执行命令pipinstallcausal_conv1d和mamba_ssm出错note:Thiserrororiginatesfromasubprocess,andislikelynotaproblemwithpip.ERROR:Failedbuildingwheelforcausal-conv1dRunningset
华为OD机考2025B卷 - 特殊的加密算法（Java & Python& JS & C++ & C ）算法大师最新华为OD机试真题华为OD机试真题 (Java/JS/Py/C)华为od java python 华为OD机考2025B卷 javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看2025华为od机试2025B卷-华为机考OD2025年B卷题目描述有一种特殊的加密算法，明文为一段数字串，经过密码本查找转换，生成另一段密文数字串。规则如下：明文为一段数字串由0~9组成密码本为数字0~9组成的二维数组需要按明文串的数字顺序在密码本里找到同样的数字串，密码本里的数字串是由相邻的单元格数字组成，上下和左右是相邻
zephyr OS 线程的使用
目录概述1线程的概念1.1线程定义1.2线程的本质定义1.3线程的核心组成要素1.4线程与进程的对比1.5线程在RTOS中的关键特性1.6线程的同步与通信1.7线程在嵌入式系统的特殊考量1.8多线程编程模型2ZephyrRTOS中线程2.1创建线程的步骤2.2ZephyrRTOS中线程定义2.3关键API函数2.4线程中的睡眠函数3线程应用实践3.1完整线程定义模板3.1.1源代码3.1.2关键细
一、Linux C/C++ 网路socket基础代码 1776323096 LinuxC/C++网络IO linux c语言 c++服务器网络
文章目录需要用到的函数1、intsocket(int__domain,int__type,int__protocol);2、intbind(int__fd,__CONST_SOCKADDR_ARG__addr,socklen_t__len);3、intlisten(int__fd,int__n);4、intaccept(int__fd,__SOCKADDR_ARG__addr,socklen_t*
JS 与 CSS 的交互式开发：打造灵动的网页体验维他奶糖61 pandas 数据库前端
在当今的网页开发领域，静态的网页早已无法满足用户日益增长的交互需求。JavaScript（JS）和层叠样式表（CSS）作为前端开发的两大支柱，它们的强强联合能够创造出令人惊叹的交互式网页效果。从简单的按钮点击变色，到复杂的动画过渡和动态页面布局变换，JS与CSS的交互式开发赋予了网页生命与活力。接下来，就让我们深入探索这一奇妙的领域。理解JS与CSS的分工与协作在开始交互式开发之前，我们需要明确J
一文读懂Kubernetes之 K8s 概述野熊佩骑 Linux系统应用运维 kubernetes 容器云原生 docker 微服务 kubelet devops
目录一、Kubernetes集群组件(一)、控制平面组件(ControlPlaneComponents)1、kube-apiserver2、etcd3、kube-scheduler4、kube-controller-manager5、cloud-controller-manager(可选的)(二)、节点组件1、kubelet2、kube-proxy(可选的)3、容器运行时(Containerrun
JavaEE：分布式session
一、使用Redis存储分布式session：1.SpringBoot整合Redis，见如下地址：JavaEE：SpringBoot整合Redis_a526001650a-CSDN博客2.代码实现分布式session存储(此处以token为例)：@AutowiredprivateRedisTemplateredisTemplate;//Redis数据操作类//登录接口，存储token到redis中@
Flutter：BLE蓝牙开发杨先生_ Flutter flutter
说明：使用flutter_blue_plus插件实现低功耗蓝牙开发。一、添加蓝牙权限：1.Android网络权限(工程/android/app/src/main/AndroidManifest.xml)：2.iOS蓝牙权限(工程/ios/Runner/Info.plist)： ... NSBluetoothAlwaysUsageDescription NeedBLEpermission N
我用这10个工具，开发效率提升了3倍！ ZoeXu-Arch 人工智能 ai python 数据库自动化
大家好，我是Zoe，今天来和大家聊聊开发效率这件事。前言：选对工具，开发效率直接起飞在这个卷出银河系的时代，写得快、测得稳、部署无感，才是开发者的核心竞争力。真正拉开人与人差距的，不只是编码能力，而是你有没有一整套趁手的“开发武器库”。最近我测试并整理了10款亲测有效、提升开发效率的神器，涵盖：AI编程助手、本地开发环境、数据处理、DevOps流水线……一句话总结：这10个工具，顶得上一个团队。希
数据库领域下的时序数据库并发控制数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库时序数据库 ai
时序数据库并发控制：原理、实现与最佳实践关键词：时序数据库、并发控制、MVCC、时间戳排序、乐观并发控制、分布式事务、性能优化摘要：本文深入探讨时序数据库中的并发控制机制，从基本原理到实际实现进行全面剖析。文章首先介绍时序数据库的特点和并发控制挑战，然后详细分析MVCC、时间戳排序等核心算法原理，并通过代码示例展示实现细节。接着探讨分布式环境下的特殊考量，提供性能优化策略和实际应用案例。最后展望未
PART 7 视频 qq_39717490 音视频 opencv 人工智能
在Debian10上安装OpenCV的两种方法：从存储库和源代码中安装OpenCV_debianopencv-CSDN博客本人的树莓派系统是pi@pi:~$lsb_release-aNoLSBmodulesareavailable.DistributorID:DebianDescription:DebianGNU/Linux12(bookworm)Release:12Codename:bookwo
Linux下基于C++11的socket网络编程(基础)个人总结版丯是幡动网络 linux c++分布式
跟着这个人做的，感觉是一个非常好的socket入门的代码，而且文件命名也有，代码还全，复制就能跑，对小白非常友好https://blog.csdn.net/RMB20150321/article/details/121478376?spm=1001.2014.3001.5502一共五个版本从简单到难，打算和这个博主一样做。另外，感谢deepseek救我狗命阅读建议：直接先看2，有函数不懂的看1找。
JavaEE：CAS单点登录杨先生_ JavaEE java-ee java
说明：CAS单点登录用于实现多个顶级域名不同的系统或各子系统实现统一登录，一处登录，各系统免登录。JWT工具类实现：JavaEE：JWT生成/解析token与Spring拦截器_jwt可以解析token吗-CSDN博客一、CAS登录/登出实现：1.单点登录(创建全局ticket+临时ticket)：/** *登录CAS系统(供CAS登录页调用) *1.登录验证，并创建用户分布式会话(Token存入
测试day01理论 skk_ks
软件测试基础一.什么是软件测试顾名思义，就是在顾名思义，就是在规定的条件下对一个产品或程序进行操作，以发现程序错误，衡量软件质量，并对其是否能满足设计要求进行评估的过程二.发展现状目前国内软件产业规模越来越大，国内软件行业突破了传统的作坊式生产，从单打独斗的开发模式升级为工业化、流水线式的生产模式，导致专业的软件测试人才需求缺口巨大。据悉，目前国内软件测试和开发人员比例大约在1：4—1：5，而国外
Golang Kratos 系列：业务分层的若干思考（二） TransPlus golang 开发语言后端
上一篇文章简单讨论了领域层在Kratos中的使用，主要涉及引入领域层，将数据层和业务层之间的解耦，接下来讨论一个稍微全面一点的例子，在此基础上引入外部Api（主要是易变部分）的领域层下的情况。我们同样可以通过依赖倒置和适配器模式实现统一治理：一、升级后的领域层架构internal/├──domain（biz）#核心领域层│├──user.go#用户聚合根│├──payment.go#支付领域服务接
Nginx安装指南 houzhihui Web Service Linux学习 nginx
Nginx安装指南1.版本选择2.RHEL/CentOS基于官方yum源安装3.Ubuntu基于官方apt安装4.编译安装4.1集成三方模块编译安装nginx4.2nginxopenssl模块升级4.3隐藏Nginx版本号5.官方参考文献1.版本选择Nginx的安装版本分为Mainlineversion(主要开发版本，其实就是还处于开发版)、Stableversion(当前最新稳定版)和Legac
day04 链表part02
24.两两交换链表中的节点想不明白的时候，画图会很直观。写好操作的伪代码，按照伪代码写。classSolution{publicListNodeswapPairs(ListNodehead){if(head==null||head.next==null){//0个或者1个，直接返回returnhead;}ListNodedummy=newListNode(0);dummy.next=head;Li
探索GORM：Go语言中的开发友好型ORM库
探索GORM：Go语言中的开发友好型ORM库gormThefantasticORMlibraryforGolang,aimstobedeveloperfriendly项目地址:https://gitcode.com/gh_mirrors/gor/gorm在Go语言的生态系统中，有一颗璀璨的明星——GORM，为开发者们带来了高效且直观的对象关系映射（ORM）体验。这是一篇专为那些寻求数据库操作简便性
主线程，协程和互斥锁 aliven1 go golang
packagemain//路径上加上包的唯一标识demo14,线程和协程，是go的核心import("fmt""time""sync")//需求：计算1-200之间所有数的阶乘，并且把各个数的阶乘放入map中。最后显示出来。使用协程完成。var(map1=make(map[int]int,10)//声明一个全局maplocksync.Mutex//互斥锁)funcmain(){fori:=1;i<
《凤凰架构》C7-分布式服务 Epi_HHH 阅读笔记 java
目录一、服务发现二、网关路由三、负载均衡一、服务发现服务发现就是动态定位服务实例地址，解决分布式环境下服务实例IP和端口可能变化的问题1）基础概念远程服务调用精确坐标：全限定名+端口号+服务标识，如：order-service.default.svc.cluster.local:50051/com.example.order.OrderService/getOrderById服务标识：与具体的应用
Go语言的单元测试与基准测试详解旧游无处不堪寻 golang 单元测试测试工具测试用例 jenkins 集成测试功能测试
单元测试以一个加法函数为例，对其进行单元测试。首先编写add.go文件：//add.gopackagemainfuncadd(a,bint)int{returna+b}其次编写add_test.go文件，在go语言中，测试文件均已_test结尾，这里只需要在被测试的文件后加上_test即可。并且测试文件与要被测试的文件需要放在同一个包中，并不像Java那样需要将所有的测试文件放在一个专门的测试文件
FineWeb数据集 frostmelody 人工智能
FineWeb数据集根据您提供的文档链接，我将对FineWeb数据集进行全面解析。FineWeb是HuggingFace在2024年发布的一项革命性开源AI训练数据集，它通过提供高质量、大规模的数据，打破了AI训练数据的垄断局面。以下解析基于文档内容，分为几个核心部分：FineWeb的定义与规模、其重要性、主要突破点，以及制作过程的全貌。我会在相关部分嵌入文档中的图片，以增强理解。所有图片均来自文
Node.js 中的 JWT 认证：从生成到验证的完整指南盛夏绽放 node.js 有问必答后端
文章目录Node.js中的JWT认证：从生成到验证的完整指南一、JWT是什么？为什么需要它？传统session与JWT对比二、JWT的结构解析三、Node.js中实现JWT1.安装jsonwebtoken包2.生成JWT3.验证JWT4.错误处理大全四、高级应用场景1.刷新令牌机制2.在不同路由中的验证中间件五、安全最佳实践六、常见问题解答七、完整示例代码结语主要内容包括：使用jsonwebtok
通过本地LLM搭建本地RAG TBM矩阵 #AI体系学习人工智能
整体思路通过ollama下载并搭建本地大预言模型LLM。通过ollama搭建embedding模型。通过langchain文件加载器加载本地内容文件（PDF文件）。通过langchain调用embedding模型进行向量存储和RAG检索。通过langchainprompts实现提示词工程。通过langchain调用LLM模型实现RAG生成，完成对本地文件的分析。准备环境服务器：CentOSLinu
用Pytorch训练手写签名模型并进行签名识别 TBM矩阵 #AI体系学习 pytorch 人工智能 python
整体思路收集至少两个人的手写签名图片，每个人至少20张使用Pytorch进行模型训练使用Flask搭建Web服务使用Html/JavaScript实现前端调用进行签名识别项目结构signature-systemdatatrainuser001001.png...user002001.png...templatesindex.htmlapp.pymodel.pytrain.py建模：model.py
TensorFlow运行时核心：DirectSession::Run全解析 Jay Kay tfserving c++tensorflow 分布式
TensorFlow运行时核心：DirectSession::Run全解析TensorFlow的本地执行模式通过DirectSession::Run实现高效计算图处理，其核心流程分为三个阶段：图剪枝生成ClientGraph、设备间图分裂、跨设备并发执行。下面结合源码层设计深入剖析各环节实现原理。一、图剪枝：从FullGraph到ClientGraph目标：根据Session::Run指定的输入（
Node.js特训专栏-实战进阶：7.Express模板引擎选型与使用爱分享的程序员 Node.js node.js 前端 javascript
欢迎来到Node.js实战专栏！在这里，每一行代码都是解锁高性能应用的钥匙，让我们一起开启Node.js的奇妙开发之旅！Node.js特训专栏主页专栏内容规划详情Express模板引擎选型与使用全解析：打造动态Web页面的利器在基于Express构建Web应用时，模板引擎是生成动态页面的核心组件。它允许开发者将数据与HTML结构分离，通过简单的语法将后端数据动态填充到页面中。市面上存在多种模板引擎
linux安装elasticsearch-head（快速，详细） Dyansts linux elasticsearch 运维 npm centos
前提见此文章https://blog.csdn.net/rj2012001/article/details/121816878?spm=1001.2014.3001.55011.下载zip格式在elasticsearch文件夹wgethttps://codeload.github.com/mobz/elasticsearch-head/zip/refs/heads/master2.解压zip文件u
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，