panda_dbdx

大模型理论基础初步学习笔记——第二章大模型的能力

大模型理论基础初步学习笔记——第二章大模型的能力
- 2.1概述
- - - 我们的研究对象：
    - 2.1.1基准测试：
    - 2.1.2结果：
    - 2.1.3结论：
    - 2.1.4总结（太长不看版）：
- 2.2 语言模型的适应性：从语言模型到任务模型的转化
- - - 2.2.1任务:
    - 2.2.2适应（Adaptation）:
    - 2.2.2.1输入(2个)：
    - 2.2.2.2适应方法(2个)：
    - - 2.2.2.2.1训练（标准的有监督学习）：
        
        2.2.2.2.2提示（上下文）学习：
        
        2.2.2.2.3对于上述中方法的名词进行解释
    - 2.2.3训练可能出现的问题
    - 2.2.4对于任务的讨论
    - 2.2.5实验任务选择
    - 2.2.6Language modeling
    - 2.2.6.1语言模型和困惑度：
    - 困惑度（Perplexity）：
    - 困惑度的计算公式（看看得了，看不懂问题似乎也不大）
    - 两类错误：
    - 2.2.6.2数据集和任务：
    - 2.2.7 Question answering问答任务
    - 2.2.8 Translation机器翻译
    - 2.2.9 Arithmetic算术
    - 2.2.10 News article generation新闻文章生成
    - 2.2.11 Novel tasks新颖任务
    - 2.2.12 其他任务
    - 2.2.13总结
    - 2.2.14任务讨论总结回答（回答2.2.4）
- 本篇学习心得总结（彩蛋）：
- 参考：

大模型理论基础初步学习笔记——第二章大模型的能力

本文GitHub地址https://github.com/panda-like-bamboo/Study-CS324

2.1概述

我们的研究对象：

GP-3

2.1.1基准测试：

标准的自然语言处理（NLP）基准测试，例如问题回答；
一些特殊的一次性演示，例如在句子中使用新词。

2.1.2结果：

在某些任务上，比如语言建模，GPT-3大幅度超越了现有技术的最高水平；
在其他任务上，GPT-3与训练有素，拥有大量标签数据的系统竞争时，却明显落后。

2.1.3结论：

在广泛的NLP任务中做得不错；
未特殊训练过度拟合，由很大的提升潜力；
对于特殊任务，可利用大量的标签数据来适应GPT-3，并超越当前的技术水平

2.1.4总结（太长不看版）：

通过标准NLP测试和一些特殊演示，我们发现GPT-3在一些任务上表现优异，如语言建模，但在与专门训练的系统竞争时，表现较差。理解这一现象的关键是GPT-3未专门为这些任务进行训练，而是作为通用语言模型。尽管如此，GPT-3在广泛的NLP任务中表现良好，且因未过度拟合，具备在其他任务上发挥潜力的可能性。对于特定任务的优化，使用大量标签数据可以帮助适应GPT-3并超越当前技术水平。总体而言，GPT-3展示了通用性，但特定任务的性能提升可能需要更多专业知识和数据。

2.2 语言模型的适应性：从语言模型到任务模型的转化

在自然语言处理的世界中，语言模型 $p$ 是一种对token序列 ${x_{1:L}}$ 的分布。

其实这一部分主要通过展示gpt-3的优越性能，来告诉大家这个大模型怎么怎么好，以及其中怎么转化的。总而言之，gpt-3真不错。（笑）

2.2.1任务:

被定义为从输入映射到输出。

2.2.2适应（Adaptation）:

指代将语言模型转化为任务模型的过程。

2.2.2.1输入(2个)：

任务的自然语言描述；
一组训练实例（输入-输出对）。

2.2.2.2适应方法(2个)：

训练（标准的有监督学习）
提示（上下文）学习

2.2.2.2.1训练（标准的有监督学习）：

训练一个新模型，使其能够将输入映射到输出。
创建新模型并利用语言模型作为特征（探针法）。
或者从现有的语言模型出发，根据训练实例进行更新（微调）。
或者在创建新模型和微调之间找到平衡（轻量级的微调）。

2.2.2.2.2提示（上下文）学习：

根据任务描述创建一个或一组提示/上下文信息，将其输入到语言模型中以获取基于该任务的生成结果。
根据提示/上下文信息的数量，可以进一步细分为：
零样本学习(Zero-shot)：模型直接基于对任务的理解输出结果，即不使用任何提示/上下文信息。
单样本学习(One-shot)：模型基于1个例子，这种情况下，使用一个示例来更好地理解任务从而生成更好的结果。
少样本学习(Few-shot)：模型可以看到更丰富的例子，一般来说，使用多个例子可以获得比单样本学习更好的效果。

训练适用于一般的有监督学习，而提示学习则允许通过提示/上下文信息进行零样本、单样本或少样本学习，以更好地适应各种任务。

2.2.2.2.3对于上述中方法的名词进行解释

探针（probe）：
通常指的是一个额外的模型或一组参数，被添加到一个已经训练好的模型之上，以用于执行特定的任务或评估模型对任务的性能。探针的目的是在不改变原始模型结构的情况下，通过在模型的中间层或输出层添加额外的参数，使得模型适用于特定任务。
在上文提到的"创建新模型并利用语言模型作为特征（探针法）"中，探针就是指将语言模型作为特征嵌入到新模型中。这个新模型（探针）在原始模型（如语言模型）的输出上进行训练，以适应特定任务。这样的探针充当了新模型与语言模型之间的连接，使得模型能够在新任务上表现良好，同时充分利用了语言模型在通用语言理解上的优势。
总体来说，"探针"是一种策略，用于将已有模型应用于特定任务或领域，而不必重新训练整个模型。通过添加探针，可以更灵活地利用已有模型的通用性，并在特定任务上实现更好的性能。

微调：
微调是指在一个已经训练好的模型的基础上，通过使用新的、任务相关的数据集进行进一步的训练，以调整模型的参数，使其适应新任务。微调的目的是在不从头开始训练模型的情况下，使模型适应于特定的应用或领域。
微调的优势在于，它可以在已有模型的基础上，通过相对较少的训练步骤就能够适应新任务，从而节省计算资源和时间。这对于任务特定的应用场景非常有用，尤其是当已有模型在通用领域已经表现很好时。

轻量级的微调：
这表示在新模型和微调之间进行一些权衡，以平衡通用性和任务特定性。这可能涉及在模型中引入一些特定任务的结构或调整模型的某些方面，而不完全创建全新的模型。

2.2.3训练可能出现的问题

过拟合

2.2.4对于任务的讨论

定义：任务是什么，以及其动机？
适应：我们如何通过提示将任务简化为语言模型？
结果：与该任务的最先进模型相比，GPT-3的定量性能如何？
目的：查看模型的大小和上下文训练实例的数量是否真的重要？

（这一部分到文末会进行总结）

2.2.5实验任务选择

Language modeling （预测）（此部分包含对于困惑度的讲解）
Question answering （输入问题输出问题）
Translation （翻译）
Arithmetic （抽象逻辑，做算术题）
News article generation (给标题写文章)
Novel tasks （文字功底）

2.2.6Language modeling

2.2.6.1语言模型和困惑度：

语言模型（Language Modeling）：在NLP中，语言模型用于对给定的文本序列计算概率分布。作者提到语言模型可以评估序列（如给定的文本序列的概率）或生成完整的序列。一个典型的任务是给定一个上下文，预测下一个词的概率。

困惑度（Perplexity）：

是衡量语言模型性能的指标，用于评估模型在预测下一个词时的不确定性。困惑度越低，表示模型在预测时越准确。具体计算方式是对模型在测试集上的负对数似然值取指数平均。这个指标可以理解为模型对每个词的平均“分支因子”，即模型认为在每个位置有多少种可能的词。
例如，若困惑度为10，那意味着每次模型在预测下一个词时，平均上会考虑10个词作为可能的选择。
不取算数平均，取几何平均。

困惑度的计算公式（看看得了，看不懂问题似乎也不大）

$\text{Perplexity } p(x_{1:L}) = \exp\left(\frac{1}{L}\sum_{i=1}^{L} \log p(x_i \mid x_{1:i-1})\right)$

x1:L：表示一个长度为 L 的序列，例如文本中的一段话或一篇文章。
p(xi | x1:i−1)：表示在给定前面的词序列 x1:i−1 后，模型预测下一个词 xi 出现的条件概率。这个概率值是模型在训练过程中学到的。
log p(xi | x1:i−1)：对上述条件概率取对数，这样做有助于处理概率相乘时的数值稳定性问题。
∑ i=1 to L log p(xi | x1:i−1)：对整个序列中每个位置的条件概率取对数后求和，得到一个表示整个序列概率的对数似然值。
1/L：对上述对数似然值取平均，即除以序列的长度 L。这是为了得到每个词的平均预测不确定性。
exp(∑ i=1 to L log p(xi | x1:i−1) / L)：最后，对上述平均对数似然值取指数，得到最终的困惑度。

两类错误：

召回错误：语言模型未能正确地为某个词符分配概率值。这种情况下，困惑度是毫不留情的。
精确度错误：语言模型为某些错误的词序列过度分配了概率值。在这种情况下，困惑度会进行适度的惩罚，如混入5%的问题信息，就会由5%的概率出现一个没有意义的词。

这里面由公式来看能证明这两个的问题，不过为了简略一点，此处不放公式了。总而言之，如果分配的很离谱，比如概率为0，困惑度为无穷，就会被公式甄别处理；如果分配仅仅是精度上的问题，公式就不能很好解决

2.2.6.2数据集和任务：

Penn Tree Bank (PTB)：是一个经典的NLP数据集，最初用于句法解析任务。在这里，作者使用PTB数据集来评估语言模型的性能。通过将整个文本作为提示输入到GPT-3中，并计算困惑度，作者展示了GPT-3在这个任务上的表现超过了先前的最佳结果（state-of-the-art）。
注意： 数据泄露是当前大型数据集的另一个复杂问题：很难检查你的测试数据是否出现在你的训练数据中，并被记忆下来。
LAMBADA：是一个任务，要求模型预测句子的最后一个词。通过构建输入-输出映射，使用额外的示例进行上下文学习，作者展示了GPT-3在这个任务上的性能较先前的最佳结果（GPT-2）更好。
HellaSwag：是一个多项选择任务，旨在评估模型进行常识推理的能力。作者使用语言模型为每个候选答案打分，并预测“最佳”答案。虽然GPT-3在这个任务上表现良好，但没有超过最先进水平（state-of-the-art）。
注意： 这玩意就是选择题选择最优项

2.2.7 Question answering问答任务

在问答任务中，模型需要回答一个问题，而不依赖于外部数据库或文档。举例来说：

Input: What school did Burne Hogarth establish?
Output: School of Visual Arts

这里使用的数据集包括 TriviaQA，WebQuestions，NaturalQuestions。GPT-3 在这些任务上的性能与其他模型（如RAG）相比较好。

2.2.8 Translation机器翻译

机器翻译任务是将源语言的句子翻译成目标语言的句子。对于德语到英语的翻译，GPT-3 在 zero-shot 和 few-shot 的情况下都取得了较好的结果。这显示了即使在没有监督训练数据的情况下，GPT-3 也能达到与全监督系统相媲美的水平。

2.2.9 Arithmetic算术

在算术任务中，模型需要解答算术问题，如加法、减法、乘法。虽然这不是 GPT-3 的主要任务，但模型在这个任务上表现出令人惊讶的结果。

2.2.10 News article generation新闻文章生成

在新闻文章生成任务中，给定标题和副标题，模型需要生成一篇新闻文章。人类评分结果显示，人类仅有52%的时间能够正确地区分“人类”与“机器”。

2.2.11 Novel tasks新颖任务

在新颖任务中，模型需要执行一些新颖的任务，如使用新造词生成句子，或者纠正不合语法的句子。

2.2.12 其他任务

除了上述任务之外，GPT-3 还应用于多个其他任务，包括基准数据集和一次性演示。这些任务涵盖了词汇替换、多任务理解、问答数据集等多个领域。

2.2.13总结

本文深入研究了语言模型 $p$ 在自然语言处理中的应用，重点关注了将其从语言模型转化为任务模型的适应性过程。任务模型指的是从输入到输出的映射，而适应性方法包括训练和提示学习。在训练中，我们通过有监督学习、利用语言模型作为特征、微调以及轻量级微调等方式训练新模型。而提示学习则通过根据任务描述创建提示/上下文信息，实现零样本、单样本和少样本学习。本文引入了困惑度作为度量语言模型性能的标准，并讨论了不同任务上的实验结果，包括问答、机器翻译、算术、新闻文章生成等。总体而言，GPT-3在各类任务中表现卓越，展现了其在多领域适应性上的强大性能。

GPT-3在广泛的标准NLP基准测试和一次性任务上进行了评估。
GPT-3可以表现得极好或者非常普通。
增加模型的大小和示例的数量都有助于提高性能。
有一些启发式的方法可以将语言模型适应到感兴趣的任务。
但是为什么会有这样表现，没有人知道。

2.2.14任务讨论总结回答（回答2.2.4）

定义：任务是什么，以及其动机？
任务指的是将输入映射到输出的问题或目标。在多任务适应性中，这些任务可以涵盖问答、翻译、算术等多个领域。动机在于测试语言模型在各种任务上的通用性和适应性。
适应：我们如何通过提示将任务简化为语言模型？
通过提示学习，将任务描述或训练实例输入到语言模型中。这包括零样本、单样本和少样本学习，允许模型通过上下文信息进行适应，而无需重新训练。
结果：与该任务的最先进模型相比，GPT-3的定量性能如何？
GPT-3在问答、机器翻译、算术和新闻生成等任务上展现出卓越性能，超越了先进模型，表现出强大的通用性。
目的：查看模型的大小和上下文训练实例的数量是否真的重要
目的在于验证模型的通用性是否受模型大小和训练实例数量的影响。结果显示，GPT-3在各任务上的出色表现表明其对任务适应性的鲁棒性，不仅仅受模型规模和数据量的限制。

本篇学习心得总结（彩蛋）：

“总体而言，GPT-3在各类任务中表现卓越，展现了其在多领域适应性上的强大性能。”（本总结来自chatgpt-3.5）

参考：

[1]datawhale讲义: https://github.com/datawhalechina/so-large-lm
[2]CS324: https://stanford-cs324.github.io/winter2022/lectures/

微信小程序和uni-app的区别 cccv工程师微信小程序 uni-app notepad++
开发语言和框架：Uni-app：Uni-app使用Vue.js框架进行开发，利用Vue的语法和生命周期函数，开发者可以使用熟悉的前端技术栈。微信小程序：微信小程序使用自己的框架，基于WXML（类似于HTML）和WXSS（样式语言）进行开发，需要学习微信小程序独有的语法和组件。平台支持：Uni-app：Uni-app是一个跨平台开发框架，可以将一套代码编译成多个平台的应用，包括微信小程序、H5、Ap
AI程序员大逃杀：从“码农”到“魔法师”的奇幻漂流 ——揭秘人工智能如何重塑程序员工作流 lifire_H 人工智能
当程序员遇上AI，是“饭碗不保”还是“原地飞升”？这场代码界的工业革命，正在让每个程序员经历从“流水线工人”到“科技魔法师”的奇幻蜕变。一、效率革命：当键盘遇上“读心术”1.需求分析：从“鸡同鸭讲”到“灵魂共鸣”还记得那些年被客户需求文档支配的恐惧吗？甲方爸爸一句“我想要五彩斑斓的黑”，就能让产品经理和程序员集体崩溃。现在，AI就像个自带翻译机的“需求捕手”——把客户支离破碎的诉求往WPSAI里一
啸叫抑制（AFS）从算法仿真到工程源码实现-第一节-效果演示 aflyingwolf_pomelo 语音信号处理算法人工智能
一、概述啸叫抑制算法也叫声反馈抑制，本专题我们讨论啸叫抑制算法的平台搭建，算法仿真和设备端的工程落地实现。完整记录一个扩声系统的搭建。更多资料和代码可以进入https://t.zsxq.com/qgmoN，同时欢迎大家提出宝贵的建议，以共同探讨学习。二、啸叫抑制算法视频演示啸叫抑制算法演示视频三、语谱图3.1产生啸叫效果3.2去啸叫后的效果四、总结这一节我们主要记录了啸叫抑制（去啸叫）算法的效果演
Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅步子哥 AGI通用人工智能语言模型人工智能自然语言处理
在浩如烟海的人工智能技术中，构建和调教大语言模型（LLMs）的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据，让模型在知识的海洋中游刃有余。我们将透过一篇最新的研究《TheBestInstruction-TuningDataareThoseThatFit》，探索如何通过选择与目标模型分布高度契合的数据来优化监督式微调（SFT）的效果，以及这一方法如何
MySQL 奇幻之旅：从基础探秘到高级应用魔法进阶的华夫饼进大厂 mysql 数据库
MySQL奇幻之旅：从基础探秘到高级应用魔法在数据库的神秘世界里，MySQL宛如一座蕴藏无尽宝藏的城堡，我怀揣着探索的热情与求知的渴望，踏上了这趟扣人心弦的学习征程。一、MySQL基础：城堡基石的雕琢（一）数据库与表的操作：构建数据的栖息之所数据库创建与管理：绘制数据城堡的蓝图：犹如精心绘制城堡的设计图，我熟练掌握了使用CREATEDATABASE语句创建数据库的魔法咒语，像CREATEDATAB
服务器上部署springboot项目学习笔记 Warren98 服务器 spring boot 学习后端阿里云 java
Java相关命令运行jar包:在linux中,进入到jar包所在目录后,直接tab补全名称即可java-jarjar包名称查看jar包是否在运行：ps-ef|grepjava终止运行的jar包:kill#是jar包的id根据jar包名称查看运行状态psaux|grepMyBlog-0.0.1-SNAPSHOT.jar设置jar包一直运行每次启动jar包时,都需要打开SSH远程连接工具,比如fina
深度学习：让机器学会“思考”的魔法 AI极客Jayden　 AI 深度学习
文章目录引言：从“鹦鹉学舌”到“举一反三”一、深度学习是什么？1.定义：机器的“大脑”2.核心思想：从数据中“悟”出规律二、深度学习的“大脑”结构：神经网络1.神经元：深度学习的基本单元2.神经网络：多层“神经元”的组合3.深度：为什么需要多层？三、深度学习如何“学习”？1.训练过程：从“笨拙”到“熟练”2.损失函数：衡量“错误”的尺子3.反向传播：从错误中“反思”四、深度学习的“超能力”1.图像
珍藏！Java SpringBoot 精品源码合集约惠来袭，获取路径大公开秋野酱 java spring boot 开发语言
技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。文末获取源码联系文末获取源码联
相同的问题看看Grok3怎么回答-详细讲讲PPO & GRPO原理释迦呼呼 AI一千问人工智能深度学习机器学习语言模型算法神经网络计算机视觉
关键要点研究表明，PPO（近端策略优化）是一种稳定高效的强化学习算法，适用于单代理或多代理场景，重点是最大化绝对奖励。GRPO（基于梯度的相对策略优化）似乎是专为多代理系统设计的，优化代理之间的相对表现，目前信息有限，可能较少为人所知。这两个算法在目标和应用领域上有显著差异，PPO更通用，GRPO更适合竞争性多代理环境。关于PPO的解释什么是PPO？PPO，全称近端策略优化，是一种强化学习算法，帮
第三十九个问题-详细讲讲PPO & GRPO原理释迦呼呼 AI一千问人工智能深度学习机器学习语言模型自然语言处理算法
PPO（ProximalPolicyOptimization）原理详解PPO（近端策略优化）是OpenAI于2017年提出的强化学习算法，旨在解决传统策略梯度方法中训练不稳定和样本效率低的问题。其核心思想是通过限制策略更新的幅度，确保新策略不会偏离旧策略太远，从而稳定训练过程。1.策略梯度（PolicyGradient）基础策略梯度方法通过直接优化策略参数θθ来最大化期望回报。目标函数为：J(θ)
基于推理的强化学习智能体设计与开发由数入道人工智能人工智能多智能体强化学习知识推理
1.理论基础与核心概念1.1推理强化学习（Reasoning-EnhancedRL）定义核心思想：在传统强化学习的马尔可夫决策过程（MDP）基础上，引入符号推理、因果推断和知识引导机制，解决复杂环境中的长程依赖和稀疏奖励问题。数学建模：扩展MDP为R-MDP：⟨S,A,P
基于Python+Django的可视化学习系统设计与实现（毕业设计源码+技术文档+系统部署）逐梦设计 Python毕业设计实战案例 python django 课程设计 vue.js 毕业设计源码
博主简介作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验，被多个学校常年聘为校外企业导师，指导学生毕业设计并参与学生毕业答辩指导，有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、
Python图形界面(GUI)Tkinter笔记（十四）：Entry与Button的碰撞（1）小叶肥辉 tkinter python gui tkinter
用功能按钮(Button)、单行文本输入框(Entry)、文本框内容读取(get)实现一个极简易的加法运算，及与其他控件的交互，提高体验，主要体现其人机交互的意义。因为Entry()文本输入框没有限制输入内容属性的参数，它是把所有的输入都视作它特有的一个类属性，所以用get()方法读取出来是一个字符串而这字符串可包括字母或其它符号。因此我们必须对其进行判断后再计算，若直接计算可能会出现不可预料的错
langchain chroma 与 chromadb笔记 phynikesi langchain 笔记 chromadb
chromadb可独立使用也可搭配langchain框架使用。环境：python3.9langchain=0.2.16chromadb=0.5.3chromadb使用示例importchromadbfromchromadb.configimportSettingsfromchromadb.utilsimportembedding_functions#加载embedding模型en_embeddin
AI 生成 PPT 网站介绍与优缺点分析 KL_lililli 人工智能 powerpoint
随着人工智能技术不断发展，利用AI自动生成PPT已成为提高演示文稿制作效率的热门方式。本文将介绍几款主流的AIPPT工具，重点列出免费使用机会较多的网站，并对各平台的优缺点进行详细分析，帮助用户根据自身需求选择合适的工具。1.免费及免费试用机会较多的网站1.1Tome网址：Tome–TheAIassistantforsales简介：Tome是一款专注于AI助力讲故事与演示制作的工具，用户只需输入简
机器学习驱动的智能化电池管理技术与应用满木悦电池化学机器人化学电池机器学习人工智能硕博研究生
在人工智能与电池管理技术融合的背景下，电池科技的研究和应用正迅速发展，创新解决方案层出不穷。从电池性能的精确评估到复杂电池系统的智能监控，从数据驱动的故障诊断到电池寿命的预测优化，人工智能技术正以其强大的数据处理能力和模式识别优势，推动电池管理领域的技术进步。据最新研究动态，目前在电池管理领域的人工智能应用主要集中在以下几个方面：1.状态估计：包括电池的荷电状态（SOC）和健康状态（SOH）的实时
目标检测YOLO实战应用案例100讲-基于深度学习的无人机目标检测算法轻量化研究（中）林聪木目标检测 YOLO 深度学习
目录基于改进YOLOv5的无人机图像实时目标检测4.1引言4.2基于改进YOLOv5的目标检测模型结构4.3消融实验及结果分析4.4算法迁移验证实验基于Jetson-Xavier的模型优化部署5.1引言5.2基于人在回路的目标检测模型裁剪5.3嵌入式实时目标检测交互软件基于深度学习的无人机目标检测算法轻量化研究知识拓展基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的无人机目标检测1.数
0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS 百度云大模型gpu
01什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机，是接受客户输入prompt和生成返回response的枢纽，也是拉起异构硬件，将物理电能转换为人类知识的变形金刚。大模型推理引擎的基本工作模式可以概括为，接收包括输入prompt和采样参数的并发请求，分词并且组装成batch输入给引擎，调度GPU执行前向推理，处理计算结果并转为词元返回给用户。和人类大脑处理语言的机制类似，大模型首
AI算力要变天了？一文搞懂ASIC和GPU asicgpuai芯片
近期，全球股市的动荡中，ASIC和GPU这两个科技股概念突然变得火热，引起了市场的高度关注。博通作为ASIC的代表，股价一路猛涨，而英伟达作为GPU的代表，股价却一路下跌。这是否意味着AI算力市场即将变天？随着人工智能技术的飞速发展，AI算力的重要性日益凸显。从早期的简单模型训练到如今的大规模语言模型如ChatGPT等的出现，对算力的需求呈爆发式增长。01那什么是ASIC和GPU？ASIC：定制化
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案算法工程gpu
引言：当AI算力需求遇上“算力饥渴症”2023年，ChatGPT仅用2个月突破1亿用户，StableDiffusion让普通人秒变艺术家，但背后是单次训练消耗超10万GB内存、千亿级参数的恐怖算力需求。当全球AI企业陷入“算力饥渴症”时，一种名为算力租赁的创新模式正以每年37%的增速（MarketsandMarkets数据）重塑行业格局。本文将深度解析这一革命性服务，并聚焦搭载NVIDIARTX4
梯度下降法理论理解伶星37 机器学习人工智能
梯度下降法：看似原始却透露着机器学习的本质前提：在研究梯度下降方法之前，你要理解矩阵运算（解析解）的方法矩阵运算目前的缺点只能进行对线性函数经行分析，无法对复杂的函数经行分析什么是梯度，以及梯度向量梯度下降的形象例子以及基本思想有三个兄弟被困在山上，得要死，他们目标是看谁尽快找到山谷中的水源老大比较后选择最陡的方向随便探索一下，就朝较低处走去探测几下就走陡峭的方向梯度下降算法的核心思想就是沿着负梯
MybatisPlus 伶星37 spring boot 后端
代码部分添加依赖该代码添加位置：就是在springboot配置文件里面的pom.xml里面要添加的东西对新手说的话，如果这一步没有看懂的话，可以去看一下基础，否则这样的话不能做到理解学习//mybatis-plus的一个插件com.baomidoumybatis-plus-boot-starter3.4.2//这个是关于mysql的一种依赖mysqlmysql-connector-java5.1.
英伟达开源超强模型Nemotron-70B；OpenAI推出Windows版ChatGPT桌面客户端 go2coding AI日报 chatgpt
AI新闻英伟达开源超强模型Nemotron-70B摘要：英伟达近日开源了新型AI模型Nemotron-70B，迅速超越GPT-4o和Claude3.5Sonnet，成为AI社区的新宠。该模型在多项基准测试中表现优异，采用混合训练方法和人类反馈强化学习，模型权重已在HuggingFace发布。Niemotron-70B的开发基于Llama-3.1，且开源数据集加强其训练效果。分析指出，英伟达的策略是
头歌实践教学平台 Python程序设计实训答案（三）学习的锅头哥实践教学平台实训答案 python
第七阶段文件实验一文本文件的读取第1关：学习-Python文件之文本文件的读取任务描述本关任务：使用open函数以只写的方式打开文件，打印文件的打开方式。相关知识为了完成本关任务，你需要掌握：文本文件；open函数及其参数；文件打开模式；文件对象常用属性；关闭文件close函数。#请在下面的Begin-End之间按照注释中给出的提示编写正确的代码##########Begin###########
React Native：跨平台移动应用开发的强大框架冬冬小圆帽 react native react.js javascript
ReactNative介绍ReactNative是由Facebook开发并开源的一款基于JavaScript和React的跨平台移动应用开发框架。它允许开发者使用React的语法和组件模型来构建原生移动应用（iOS和Android）。ReactNative的核心思想是“LearnOnce,WriteAnywhere”，即学习一次，编写多端应用。1.核心特点跨平台开发：使用JavaScript和Re
AI大模型产品经理学习路线，2025最新，从AI产品经理零基础入门到精通，非常详细收藏我这一篇够了！ AGI-杠哥人工智能产品经理学习语言模型 agi 自然语言处理
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基础到精通。一、基础知识阶段1.计算机科学基础数据结构与算法：理解基本的数据结构（如数组、链表、树、图等）和常用算法（如排序
大模型实战—你的个人AI数字大脑Khoj 不二人生大模型人工智能大模型
Khoj是你的开源个人AI伴侣，提供即时答案。Khoj轻松地深入知识，简化复杂信息，整合你的个人背景，并根据你的独特需求量身定制响应。在线问题：如果你有一个问题需要从互联网获取最新的信息，Khoj可以进行在线搜索，找到相关答案。例如，查询当前的天气情况或某个新闻事件的最新动态。本地笔记和文档：如果你有很多保存的笔记、PDF文件、Markdown文档、GitHub仓库或Notion文件，Khoj可以
Java 大视界 -- 基于 Java 的大数据机器学习模型的多模态融合技术与应用（143）青云交大数据新视界 Java 大视界 java 大数据机器学习多模态融合智能安防智能客服数据处理
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

大模型理论基础初步学习笔记——第二章 大模型的能力

大模型理论基础初步学习笔记——第二章 大模型的能力

大模型理论基础初步学习笔记——第二章 大模型的能力

2.1概述

我们的研究对象：

2.1.1基准测试：

2.1.2结果：

2.1.3结论：

2.1.4总结（太长不看版）：

2.2 语言模型的适应性：从语言模型到任务模型的转化

2.2.1任务:

2.2.2适应（Adaptation）:

2.2.2.1输入(2个)：

2.2.2.2适应方法(2个)：

2.2.2.2.1训练（标准的有监督学习）：

2.2.2.2.2提示（上下文）学习：

2.2.2.2.3对于上述中方法的名词进行解释

2.2.3训练可能出现的问题

2.2.4对于任务的讨论

2.2.5实验任务选择

2.2.6Language modeling

2.2.6.1语言模型和困惑度：

困惑度（Perplexity）：

困惑度的计算公式（看看得了，看不懂问题似乎也不大）

两类错误：

2.2.6.2数据集和任务：

2.2.7 Question answering问答任务

2.2.8 Translation机器翻译

2.2.9 Arithmetic算术

2.2.10 News article generation新闻文章生成

2.2.11 Novel tasks新颖任务

2.2.12 其他任务

2.2.13总结

2.2.14任务讨论总结回答（回答2.2.4）

本篇学习心得总结（彩蛋）：

参考：

你可能感兴趣的:(学习,笔记,语言模型,人工智能,自然语言处理)

大模型理论基础初步学习笔记——第二章大模型的能力

大模型理论基础初步学习笔记——第二章大模型的能力

大模型理论基础初步学习笔记——第二章大模型的能力