hanscalZheng

大规模语言模型的模型结构--解码器结构（PaLM，BLOOM，InstructGPT系列）

与编码器结构(encoder-only) 的语言模型结构相反，解码器结构(decoder-only) 的语言模型结构只包含trans- former 结构里的 decoder 部分。在 BERT 发布之前的 GPT- 1 就是 decoder-only 的语言模型，但在 GPT-3 发布并展示其惊人表现后， decoder-only 的语言模型数量呈现井喷式地增长，直到现在依旧是占比最大的模型类型。这类模型更适合被用来执行生成词汇类任务，前面介绍过 GPT- 1，GPT-2 和 GPT-3，这里主要介绍的是模型参数量大于 100 亿的生成式大语言模型。

PaLM

PaLM，全名为 Pathways Language Model，是一款使用了 Pathways，一种能在数千或数万个加速器芯片上高效训练神经网络的机器学习系统，并在 7800 亿 token 的高质量文本上训练一个 5400 亿参数稠密激活的自回归 Transformer 。PaLM 的模型结构是在标准的 transformer 模型的 decoder 部分上进行了几处调整：

SwiGLU 激活函数使用 SwiGLU 激活函数作为 MLP 的中间激活函数，因为与其他激活函数相比能显著提高质量。
并行层在 Transformer 块中使用并行表述而非序列表述，具体来说，标准的表述为：

并行表述为：

由于 MLP 和 Attention 输入矩阵的乘法可以被融合，平行表述的方式提高了 15%大规模的训练速度。在 8B 规模模型下效果略有下降，但在 62B 规模模型下没有。由此推断并行表述对 540B 规模模型的表现没有影响。
多 Query 注意力标准的 Transformer 使用 k 个注意力头，每个时间步的输入向量被线性投影为形状为 [k, h] 的“query”，“key”，和“value”向量，其中h 是注意力头的尺寸。在这里，每个头的 key/value 投影是共享的，即 key 和 value 被投影为 [1, h]，但 query 仍被投影为 [k, h]。这对模型的质量和训练速度没有影响，但明显降低了自回归解码的时间成本。这是因为在自回归解码时 key/value 张量在实例之间不共享，而且一次只解码一个 token ，导致标准的多头注意力在加速器硬件上的效率很低。
RoPE 嵌入层使用RoPE 嵌入而非绝对或相对位置嵌入，因为 RoPE 嵌入向量在长序列的表现更好。
共享输入-输出嵌入层共享输入和输出嵌入矩阵。
无 biases 所有 dense kernels 和 layer norms 都没有使用biases ，这可以增加大模型的训练稳定性。
单词表使用带有 256k tokens 的 SentencePiece[26] 单词表，原因是为了能够支持训练语料库中的大量语言，而不需要过度 tokenization。单词表是完全无损且可逆的，说明单词表中留有空白处(对代码来说尤其重要)，且未登录的 Unicode 字符被分为 UTF-8 字节，每个字节都是一个单词表的 token。数字总会被分为单独的数值 token ( 123.4 -> 1 2 3 . 4 )。

在数据集方面， PaLM 收集了 7800 亿 token 的代表了广泛的自然语言使用样例的高质量语料。该数据集混合了过滤过的网页、书籍、维基百科、新闻文章、源代码和社交媒体对话，且该数据集是基于用于训练 LaMDA 和 GLaM 的数据集。所有的模型只训练一个 epoch，并选择混合比例避免重复数据。除了自然语言之外，该数据集中还包含代码数据。预训练数据集中的源代码是从 Github 上的开源仓库中获取的，并通过仓库中的 license 过滤文件，总共限制了 24 种编程语言且到得到了196GB 的源代码。最后基于 Levenshtein 距离移除重复的文件。

Pathways 系统跨两个 TPU v4 pods 执行两路 pod 级别的数据并行

从结果上来看， PaLM 的表现有：

该模型在 6144 个 TPU v4 芯片上高效的训练了一个 540B 参数的语言模型，这是以前的模型未曾达到过的规模。
语言模型的表现还没有随着规模的改善达到饱和点。
在许多困难的语言理解和生成任务上有突破性的能力。
在三种不同规模， 8B ，62B ，540B，的模型中，从 62B 到 540B 规模的表现变化比从 8B 到 62B 规模的表现提升的极其迅速，说明当模型达到足够大的规模时能够展现出新的能力。
优秀的多语言理解能力。
比起 8B 模型， 62B 和 540B 模型会产生更高的毒性。比起人类生成文本，模型受到提示的影响更严重。

BLOOM

BLOOM 是在 2021 年 5 月至 2022 年 5 月的一年时间里完成训练并发布的。初始版本发布于 2022 年 5 月 19 日。BLOOM 是 BigScience Large Open-science Open-access Mul-tilingual Language Model 首字母的缩写。BigScience 不是财团，也不是正式成立的实体。这是一个由 HuggingFace 、GENCI 和 IDRIS 发起的开放式协作组织，以及一个同名的研究研讨会(workshop) ，BLOOM 由 BigScience 社区开发和发布，共 60 个国家和 250 多个机构的 1000 多名研究人员参与 BLOOM 的项目，。BLOOM 是在 46 种自然语言和 13 种编程语言上训练的 1760 亿参数语言模型，该模型是在 Jean Zay 上训练的， Jean Zay 是由 GENCI 管理的法国政府资助的超级计算机，安装在法国国家科学研究中心 (CNRS) 的国家计算中心 IDRIS。所需硬件为 384 张 80GB A100 GPU，训练框架为Megatron-DeepSpeed，训练时长为 3.5 个月，训练 BLOOM 的算力成本超过 300 万欧元。

训练数据

BLOOM ROOTS 数据中的语言分布

BLOOM 是在一个称为 ROOTS 的语料上训练的，其是一个由 498 个 Hugging Face 数据集组成的语料。共计 1.61TB 的文本，包含 46 种自然语言和 13 种编程语言，共 3500 亿词元。上图中展示了该数据集的高层概览，展示了每种语言及其语属、语系和宏观区域。训练数据的处理包含以下几个步骤，如下图所示：

获得源数据: 第一步涉及到从确定的数据源中获得文本数据，这包含从各种格式的 NLP 数据集中下载和提取文本字段、从档案中抓取和处理大量的 PDF 文件、从目录中的 192 个网站条目和数据工作组成员选择的另一些地理上不同的 456 个网站中提取和预处理文本。后者需要开发新工具来从 Common Crawl WARC 文件中的 HTML 中抽取文本。我们能够从 539 个网络的所有 URL 中找到并提取可用的数据。
质量过滤: 在获得文本后，我们发现大多数源中包含了大量的非自然语言，例如预处理错误、 SEO 页面或者垃圾。为了过滤非自然语言，我们定义了一组质量指标，其中高质量文本被定义为“由人类为人类编写的”，不区分内容或者语法的先验判断。重要的是，这些指标以两种主要的方法来适应每个源的需求。首先，它们的参数，例如阈值和支持项列表是由每个语言的流利使用者单独选择的。第二、我们首先检测每个独立的源来确定哪些指标最有可能确定出非自然语言。这两个过程都是由工具进行支持来可视化影响。
去重和隐私编辑: 使用两种重复步骤来移除几乎重复的文档，并编辑了从 OSCAR 语料中确定出的个人身份信息。因为其被认为是最高隐私风险的来源，这促使我们使用基于正则表达式的编辑，即使表达式有一些假阳性的问题。

BLOOM 的数据处理步骤示意图

模型架构

虽然大多数现代语言模型都是基于 Transformer 架构，但是架构实现之间存在着显著的不同。显然，原始的 Transformer 是基于 encoder-decoder 架构的，许多流行的模型仅选择 encoder-only 或者 decoder-only 方法。当前，所有超过 100B 参数的 state-of-the-art 模型都是 decoder-only 模型。在选择架构为 Decoder 方法之后，对原始 Transformer 架构提出了许多的更改。在 BLOOM 中采用了两种变化：

ALiBi 位置嵌入: 相比于在 embedding 层添加位置信息， ALiBi 直接基于 keys 和queries 的距离来衰减注意力分数。虽然 ALiBi 的最初动机是它能够外推至更长的序列，我们发现其在原始序列长度上也能够带来更平衡的训练以及更好的下游表现，超越了可学习 embeddings 和旋转embeddings。
Embedding LayerNorm: 在训练 104B 参数模型的初步试验中，我们尝试在嵌入层后立即进行 layer nor- malization，正如 bitsandbytes 库及其 StableEmbedding 层所推荐的那样。我们发现这可以显著的改善训练稳定性。尽管我们在 Le Scao et al. 工作中发现其对 zero-shot 泛化有惩罚，但我们还是在 BLOOM 的第一个 embedding 层后添加了额外的 layer normalization 层来避免训练不稳定性。注意初步的 104B 实验中使用 float16，而最终的训练上使用 bfloat16。因为 float16 一直被认为是训练 LLM 时观察的许多不稳定的原因。bfloat16 有可能缓解对 embedding LayerNorm 的需要。

BLOOM 的架构图

InstructGPT

InstructGPT在 GPT-3 的基础上提出了“Alignment”的概念，即让模型的输出与人类的意图对齐，避免产生虚假的事实以及有害的内容。预训练模型自诞生之始，一个备受诟病的问题就是预训练模型的偏见性。因为预训练模型都是通过海量数据在超大参数量级的模型上训练出来的，对比完全由人工规则控制的专家系统来说，预训练模型就像一个黑盒子。没有人能够保证预训练模型不会生成一些包含种族歧视，性别歧视等危险内容，因为它的几十 GB 甚至几十 TB 的训练数据里几乎肯定包含类似的训练样本。因此 InstructGPT 的目标理念是有用的(helpful)，可信的(honest)和无害的(harmless)。InstructGPT 采用了 GPT-3 的结构，通过指示学习构建训练样本来训练一个奖励模型，并通过这个奖励模型的分数来指导强化模型的训练。

训练方式

InstructGPT 的训练方式分为三步，如下图所示，其中第二步和第三步的奖励模型和强化学习的 SFT 模型可以反复迭代优化：

监督微调：根据采集的 SFT 数据集对 GPT-3 进行有监督的微调(Supervised FineTune ，SFT )；
奖励模型训练：从移除了最后的 unembedding layer 的监督微调模型开始，训练了一个接收提示和回答并输出一个标化奖励的模型。这次选择了 60 亿参数的奖励模型，不仅因为这能节省成本，而且经实验， 1750 亿参数的奖励模型并不稳定。该奖励模型是在在同一输入的两个模型输出之间进行比较的数据集上进行训练。使用 cross-entropy loss，并比较标签，奖励之间的差异表示标注人员更喜欢一种回答的对数概率。为了加快对比收集，标注人员要在 K = 4 和 K = 9 的回答之间进行排名，这会为每名标注人员每个提示产生 (2(K)) 个比较。因为每个标记任务中的比较都有关联，将它们放入一个数据集中会使奖励模型过于拟合，因此要将每个提示的 (2(K)) 个对比作为单独的 batch 元素训练。这使得计算过程更加高效，因为每次完成只需要奖励模型一次的向前传递，且不会出现过于拟合，并提高了准确率。该奖励模型的损失函数为：

其中 rθ (x, y) 是提示 x，补全 y，参数为 θ 的奖励模型的标量输出， yw 是 yw 和 yl 中更好的补全， D 是人类比较的数据集。

强化学习：InstructGPT 使用 PPO[56] 作为强化学习的baseline。InstructGPT 在一个 bandit 环境中用 PPO 微调了监督微调模型。该环境展示一个随机的客户提示并期望该提示的回答。给予一个提示和回答，它产生了又奖励模型决定的奖励并结束该 episode。另外，每个 token 上被添加了监督微调模型的 KL 惩罚以轻奖励模型的过度优化。该 value function 从奖励模型初始化。这些模型叫做 PPO。为了修复公共 NLP 数据集的性能回归，预训练梯度被加入到 PPO 的梯度中，并称为“PPO-ptx”。其目标函数为：

其中 πϕ(RL) 是学习到的强化学习策略， π SFT 是监督训练模型， Dpretrain 是预训练分布。KL 奖励系数 β 和预训练损失系数 γ 分别控制 KL 惩罚和预训练梯度的强度。对于 PPO 模型， γ = 0。除非特殊说明，这里的 InstructGPT 指的都是 PPO-ptx 模型。

步骤一：监督微调。步骤二：奖励模型训练。步骤三：通过 PPO 在奖励模型上强化学习

训练数据

为了构建 InstructGPT 模型，让该模型在 OpenAI 的 PlayGround 收集指示数据，从而收集创建三个数据集，这些数据的分布情况如下图1.16所示：1. 监督微调的数据：让标注人员加上指示的答案；2. 奖励模型训练的数据：让标注人员给模型输出排序；3. 根据奖励模型标注来生成训练强化学习模型的数据。根据 InstructGPT 的训练步骤，其需要的这些数据也有些许差异：这三个数据总共加起来，有 77K 条，而其中涉及人工的，只有 46K。也就是 GPT-3 继续在 77K 的数据上进行了进一步微调，就得到了 InstructGPT。

SFT 数据集

SFT 数据集是用来训练第 1 步有监督的模型，即使用采集的新数据，按照 GPT-3 的训练方式对 GPT-3 进行微调。因为 GPT-3 是一个基于提示学习的生成模型，因此 SFT 数据集也是由提示-答复对组成的样本。SFT 数据一部分来自使用 OpenAI 的 PlayGround 的用户，另一部分来自OpenAI 雇佣的 40 名标注工(labeler)。并且他们对 labeler 进行了培训。在这个数据集中，标注工的工作是根据内容自己编写指示，并且要求编写的指示满足下面三点：

简单任务(Plain)：标注人员被要求给出一个任意的任务，并保证任务的多样性。
Few-shot 任务：标注人员想出一个指示，并提供一些问答的例子。
用户相关(User-based)：标注人员根据 OpenAI API 上用户提出的案例来构建任务，编写指示。

RM 数据集

RM 数据集用来训练第二步的奖励模型，需要为 InstructGPT 的训练设置一个奖励目标，要尽可能全面且真实的对齐我们需要模型生成的内容。可以通过人工标注的方式来提供这个奖励，通过人工对可以给那些涉及偏见的生成内容更低的分从而鼓励模型不去生成这些人类不喜欢的内容。InstructGPT 的做法是先让模型生成一批候选文本，让后通过标注人员根据生成数据的质量对这些生成内容进行排序。

PPO 数据集

InstructGPT 的 PPO 数据没有进行标注，它均来自 GPT-3 的 API 的用户。既又不同用户提供的不同种类的生成任务，其中占比最高的包括生成任务(45.6% )， QA ( 12.4%)，头脑风暴(11.2%)，对话(8.4%)等。

SFT 、RM 和 PPO 数据集的分布和大小

从结果上来看，相比于 GPT-3 ，InstructGPT 有以下特点：

标注者更倾向于 InstructGPT 的输出，在真实性上比 GPT-3 有明显进步。
InstructGPT 模型在无害性上有些进步，但在偏见方面没有明显改善。
InstructGPT 在 RLHF 微调分布之外的指令的任务也有良好表现。
RLHF 微调程序会降低模型在通用NLP 任务上的效果。
对有害的指示可能会输出有害的答复。
InstructGPT 依旧会犯简单的错误，模型会对简单概念的过分解读。

ChatGPT 是 InstructGPT 的姐妹模型，两者都使用了指示学习和人类反馈的强化学习(RLHF) 方法。但 Chat- GPT 使用了不同且规模更大的数据收集设置，以及 ChatGPT 是根据 GPT-3.5 系列中的一个模型微调获得的。

GPT-4则是 OpenAI 最新的语言模型，但至今没有公布其技术细节和代码，只给出了技术报告。比起之前的 GPT 系列， GPT-4 展现了更优秀的逻辑推理，理解图表，生成安全文本，编程，理解其他语言等能力。

ps:欢迎扫码关注公众号^_^.

innovus命令每日精要 | setCheckMode：数字后端物理设计的必备神器数字后端物理设计知识库 innovus 命令每日精要后端性能优化
在数字后端物理设计的领域中，确保设计数据的完整性和正确性是至关重要的。今天，我们要深入探讨的是Innovus中的一个强大命令——setCheckMode。这个命令就像是你的设计流程中的“健康卫士”，能够在各个阶段帮你揪出潜在的数据问题，避免因小失大，让错误在流程中扩散。检查模式核心功能大揭秘1.设计数据完整性检查：全面扫描，无死角-all选项就像是给你的设计做一次“全身CT”，开启所有检查选项，确
医图论文 CVPR‘24 | 适应医学图像中泛化异常检测的视觉-语言模型小白学视觉医学图像处理论文解读语言模型人工智能计算机视觉医学图像顶会医学图像处理 CVPR 论文解读
论文信息题目：AdaptingVisual-LanguageModelsforGeneralizableAnomalyDetectioninMedicalImages适应医学图像中泛化异常检测的视觉-语言模型作者：ChaoqinHuang，AofanJiang，JinghaoFeng，YaZhang，XinchaoWang，YanfengWang源码：https://github.com/Medi
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
2025年从DeepSeek到Manus：AI如何重塑企业价值报告600+份汇总解读|附PDF下载
原文链接：https://tecdat.cn/?p=41172当前全球AI技术正从实验室走向产业化深水区，本报告以企业价值重构为核心，通过技术演进路径、行业竞争范式、落地实施策略三大维度，揭示AI如何从成本中心转变为价值引擎。数据显示，2025年生成式AI在中国创造的潜在经济价值达2万亿美元，其中制造业、电子行业生产力增益最为显著。本报告汇总解读基于《发布机构：华中科技大学数智管理与传播研究团队、
超小巧且经济的CMOS工业相机——Vieworks的VZ系列 51camera 工业相机
今天我们来看一款超级紧凑小巧且具有成本效益的工业相机——Vieworks的VZ系列。它主要有以下四大特点：1、超紧凑的工业相机VZ系列是最小的相机，适用于广泛的机器视觉应用。由于其29mmx29mm的紧凑外壳尺寸和重量轻，VZ系列可以简单地取代大多数工业相机。2、无缝安装和高可用性PoE千兆以太网和USB3.0接口使得系统集成相对容易，减少了电缆长度和多个摄像头设置。VZ系列通过使用千兆以太网和U
【AI大模型】RAG如何让生成AI更智能？最新方法与优劣深度解析健忘的派大星人工智能语言模型 ai AI大模型 agi RAG 程序员
前言近年来，人工智能技术突飞猛进，尤其是生成式AI，简直像是开了挂一样，各种惊艳的表现让人直呼“未来已来”。根据IDC的研究，生成式AI的市场规模在2022年已经达到了107亿美元，而到2026年，这个数字预计会飙升至326亿美元！不过，尽管生成式AI很强大，但它也并非完美无缺——比如生成内容的质量、准确性和可靠性，依然有提升的空间。这时候，检索增强生成（RAG）技术登场了！RAG的核心思路很简单
windows下使用vscode+cline插件体验MCP，体验使用AI控制浏览器，踩坑记录（至少让你节省3个小时弯路版）（喂饭级别）几道之旅人工智能智能体及数字员工 windows vscode ide 人工智能
为什么网上天天说MCP，你这儿却一点动静都没有？1️⃣人家很早之前就用上了制定标准的Claudedesktop，这玩意儿在咱这儿用不了。对策：使用vscode+cline+deepseek（或其它同级别国产大模型deepseek-V3其实有时比R1效果还好）2️⃣人家也Claude，但人家能用Cursor，咱太穷了，用不了。对策：使用vscode+cline+deepseek（或其它同级别国产大模
项目管理软件的十大核心功能，一文解读！项目管理
一、项目管理软件必备的十大功能任务管理任务管理是项目管理的基石。以一个新产品发布项目为例，你可以为每个阶段创建独立任务，如市场调研、产品设计、开发和测试，并为团队成员分配责任。甘特图甘特图是在视觉上查看项目进度的最佳工具之一。通过条形图的方式来显示项目时间安排，使项目经理可以清晰地看到任务的起始和结束日期。例如，当计划一个产品发布周期时，甘特图可以帮助确定各项任务的进展，并有助于提前识别和解决潜在
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
Java 大视界 -- Java 大数据在智能体育赛事直播数据分析与观众互动优化中的应用（142）青云交大数据新视界 Java 大视界 java 大数据体育赛事直播数据分析观众互动数据采集个性化推荐
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
使用LangChain实现大规模语言模型自发现推理结构 VYSAHF langchain 语言模型人工智能 python
使用LangChain实现大规模语言模型自发现推理结构在现代自然语言处理(NLP)的研究中，大规模语言模型（LLMs）已经展示了强大的能力。然而，在应对复杂的推理问题时，传统的提示方法常常力不从心。这篇文章将带您了解SELF-DISCOVER，一种新兴的框架，如何通过LangChain来实现自动化、动态化的推理结构构建，以提高LLMs的性能。技术背景介绍大规模语言模型（如GPT-4和PaLM2）已
数据分析 SQL 面试全攻略，看这篇就够了！程功学数据分析 sql 面试
数据分析SQL面试八股文（含答案）已经打包好，看文末领取在数据分析领域，SQL技能堪称基石，也是众多企业在招聘数据分析岗位时重点考察的内容。今天，就为大家深度剖析数据分析SQL面试的要点，助力大家顺利通关。一、常见面试题型大揭秘（一）简单查询这类题目通常要求考生从单表中检索数据。例如，给定一个“员工信息表”，包含员工编号、姓名、年龄、部门等字段，题目可能是“查询年龄大于30岁的员工姓名和部门”。解
A Survey of Large Language Models大模型综述论文章节总结 WhyteHighmore 论文语言模型人工智能自然语言处理论文笔记
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型语言模型(LLM)的最新进展，重点关注其发展背景、关键发现和主流技术。文章主要围绕LLM的四个主要方面展开：1引言自从1950年图灵测试被提出以来，人类一直在探索机器掌握语言智能的方法。语言本质上是一种受语法规则支配的复杂、精细的人类表达系统，这使得开发能够理解和掌握语言的强大人工智能(AI
linux下安装卸载永中office步骤,永中集成Office For Linux安装图文指南及简介 weixin_39625975
永中集成OfficeForLinux安装图文指南及简介永中集成Office在一套标准的用户界面下集成了文字处理、电子表格和简报制作三大应用，提供自选图形、艺术字、剪贴画、图表和科教编辑器等附加功能；基于创新的数据对象储藏库专利技术，有效解决了Office各应用之间的数据集成问题，构成了一套独具特色的集成办公软件。永中集成Office用户界面和使用方式与常见Office相似，易学易用；能够双向精确兼
使用Pinecone实现自查询检索器的实现步骤 vaidfl python
##技术背景介绍Pinecone是一款功能强大的向量数据库，适用于处理复杂的检索需求。在本文中，我们将演示如何结合Pinecone向量存储使用SelfQueryRetriever实现自查询功能。为了更方便的了解原理，我们将以电影总结数据集为例进行展示。##核心原理解析自查询检索器(SelfQueryRetriever)的核心思想是通过提供文档的元数据和内容描述，结合语言模型生成查询条件来完成数据检
AI：对比ChatGPT这类聊天机器人，人形机器人对人类有哪些不一样的影响？ InnoLink_1024 AGI 人工智能机器学习 chatgpt 人工智能机器人
人形机器人与像ChatGPT这样的聊天机器人相比，虽然都属于人工智能技术的应用，但由于其具备的物理形态和与环境的互动能力，它们对人类的影响会有很大的不同。下面从多个角度进行对比，阐述它们各自对人类的不同影响：1.物理交互与虚拟交互人形机器人：具有物理形态，能够在物理世界中与人类进行直接交互。例如，搬运物品、进行日常家务、提供身体上的帮助（如扶持老人、帮助走路等），以及进行非语言的沟通（如手势、面部
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
技术转管理，需要克服的4大硬伤！项目经理刘湖南职场和发展
许多技术人员都会主动规划自己的职业发展路径，而晋升管理岗，向项目经理或者产品经理转型，是大多数技术人才的选择。然而，技术思维和管理思维存在较大的差异。从技术转管理，有四大难点。一、角色转换难技术人员作为执行层，专注的是技术实现与细节把控，只要专心做好自己份内的事即可。比如，开发工程师要保证代码质量，运维工程师负责系统稳定性。而项目经理或者产品经理作为组织者，需要建立全局视角和系统思维，带领团队成员
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用王金-太想进步了语言模型人工智能自然语言处理
应用尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，但在部署于专业领域时，LLMs仍经常遇到持续的限制，包括上下文长度受限、容易产生幻觉（hallucination）、推理能力欠佳和固有的偏见。在现实世界的应用中，这些不足显得尤为重要，因为在这些场景中，精确性、可靠性和伦理一致性是至关重要的。这些问题引发了一些根本性的探讨：(1)如何系统地提高LLM的表现以满足特定领域的需求？(2)在实
2025年亚马逊多店铺运营的三大核心策略跨境猫小妹跨境电商大数据人工智能业界资讯经验分享
2025年亚马逊多店铺运营的三大核心策略随着跨境电商市场的日趋成熟，亚马逊卖家面临的竞争加剧，特别是拥有多个店铺的商家，更需要优化运营策略，提高盈利能力。进入2025年，亚马逊多店铺运营不再是简单的铺货，而是需要更精细的管理与系统化的运营。本篇文章将为你解析三大核心策略，助你高效管理多个店铺，提升市场竞争力。一、精细化选品与差异化布局1.数据驱动选品，提升市场竞争力多店铺运营的核心在于合理配置资源
【AI大模型前沿】浙大携手阿里推出HealthGPT：医学视觉语言大模型助力智能医疗新突破寻道AI小兵 AI大模型前沿技术追踪人工智能语言模型 AIGC
系列篇章No.文章1【AI大模型前沿】深度剖析瑞智病理大模型RuiPath：如何革新癌症病理诊断技术2【AI大模型前沿】清华大学CLAMP-3：多模态技术引领音乐检索新潮流3【AI大模型前沿】浙大携手阿里推出HealthGPT：医学视觉语言大模型助力智能医疗新突破目录系列篇章前言一、项目概述二、技术原理（一）异构低秩适应（H-LoRA）（二）分层视觉感知（HVP）（三）三阶段学习策略（TLS）三、
前端 Blob 详解 yqcoder 前端 javascript 开发语言
前端Blob详解1.什么是Blob？Blob（BinaryLargeObject）表示二进制大对象，用于存储二进制数据。在前端开发中，Blob常用于处理文件、图像、视频等二进制数据。2.创建Blob可以通过Blob构造函数创建Blob对象。constblob=newBlob(array,options);array:数组，包含要放入Blob的数据。可以是字符串、ArrayBuffer、ArrayB
DeepSeek从入门到精通「清华团队」 YuKeeHgg DeepSeek 人工智能 ai
由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。「文末附下载方式」第一部分：DeepSeek基础概念1.1DeepSeek简介定义：专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。核心产品：开源
人工智能的未来：从基础到前沿的探索与展望小二爱编程· 人工智能 ai AI编程 AI写作 AI作画
1.人工智能简介内容概述：人工智能（AI）是指模拟和执行人类智能任务的技术。随着计算能力和数据量的增加，AI在各个领域取得了显著进展，从自动化的基本任务到解决复杂的实际问题，人工智能正渗透到我们生活的各个方面。2.人工智能的种类与发展内容概述：AI的种类可以按智能的复杂度分为三大类：弱人工智能（NarrowAI）：目前大多数应用都属于弱AI，如语音助手、自动驾驶等。它们专注于特定任务，并且无法扩展
知识蒸馏：从软标签压缩到推理能力迁移的工程实践(基于教师-学生模型的高效压缩技术与DeepSeek合成数据创新) AI仙人掌人工智能 AI 人工智能深度学习语言模型机器学习
知识蒸馏通过迁移教师模型（复杂）的知识到学生模型（轻量），实现模型压缩与性能平衡。核心在于利用教师模型的软标签（概率分布）替代独热编码标签，学生模型不仅学习到教师模型输出数据的类别信息，还能够捕捉到类别之间的相似性和关系，从而提升其泛化能力核心概念知识蒸馏的核心目标是实现从教师模型到学生模型的知识迁移。在实际应用中，无论是大规模语言模型（LLMs）还是其他类型的神经网络模型，都会通过softmax
联核科技AGV无人叉车有哪些常见的安全防护措施？ m0_66581510 科技安全自动驾驶自动化人工智能机器人
联核科技的AGV无人自动化叉车作为自动化设备，它的安全防护措施通常涵盖多个层面，以确保在复杂环境中安全运行。以下是联核AGV无人叉车常见的安全防护措施及技术实现方式：联核科技官网-AGV叉车十大品牌-无人叉车厂家-自动化叉车-智能搬运码垛机器人-智能叉车系统解决方案专家1.紧急停止功能措施：配备急停按钮或远程急停功能，可立即切断动力或触发紧急制动。作用：在突发情况下（如人员闯入、设备故障）快速停止
KV 缓存简介 dev.null AI 缓存
以下是关于KV缓存（Key-ValueCache）的简介，涵盖其定义、原理、作用及优化意义：1.什么是KV缓存？KV缓存是Transformer架构（如GPT、LLaMA等大模型）在自回归生成任务（如文本生成）中，用于加速推理过程的核心技术。其本质是：在生成序列时，缓存历史token的Key和Value矩阵，避免重复计算，从而显著减少计算量。2.为什么需要KV缓存？传统自注意力计算的问题在生成第t
留给小米汽车的时间，不到三年了智瑾财经物联网区块链 big data
留给小米汽车的时间，不到三年了出品l观点财经作者l大钊今年3月30日，小米科技创始人、董事长雷军决定向被誉为“制造业皇冠”的汽车制造领域发起冲击。“这是我人生最后一次重大创业项目。我愿意押上人生全部的声誉，全力以赴去做小米汽车！”他说。如今，距离小米官宣造车已经过去七个多月了，小米汽车的成绩如何？2021年9月1日，小米汽车正式注册；首个工厂将落户北京亦庄；截至10月18日，共收到2万多份简历，到
红黑树详解？红黑树设计的背景？ F_windy java
红黑树详解1.红黑树的基本概念红黑树（Red-BlackTree）是一种自平衡的二叉搜索树（BST），通过节点颜色（红或黑）和一组规则来保持近似平衡，确保插入、删除、查找等操作的时间复杂度为O(logn)。它的核心思想是通过颜色标记和旋转操作，减少树的高度差异，从而提升性能。2.红黑树的五大规则红黑树必须满足以下规则：颜色规则：每个节点非红即黑。根节点规则：根节点必须是黑色。叶子节点规则：所有叶子
如何针对大Excel做文件读取？ F_windy excel
针对大Excel文件（如超过百万行）的读取，传统的一次性加载到内存的方式会导致内存溢出（OOM），需采用流式读取（Streaming）或分块读取（Chunk）的策略。以下是具体方案及优化建议：一、核心解决方案1.使用ApachePOI的SAX模式（事件驱动）适用场景：处理.xlsx文件（不支持.xls），逐行解析避免内存溢出。代码示例（Java）：importorg.apache.poi.open
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

大规模语言模型的模型结构--解码器结构（PaLM，BLOOM，InstructGPT系列）

PaLM

BLOOM

训练数据

模型架构

InstructGPT

训练方式

训练数据

你可能感兴趣的:(大语言模型,语言模型,palm,人工智能)