Sonhhxg_柒

【NLP】培训LLM的不同方式

在大型语言模型（LLM）领域，存在多种具有不同手段、要求和目标的培训机制。由于它们有不同的用途，因此重要的是不要将它们相互混淆并了解它们适用的不同场景。

在本文中，我想概述一些最重要的训练机制，包括预训练、微调、人类反馈强化学习 (RLHF)和适配器。此外，我将讨论提示的作用，提示本身不被认为是一种学习机制，并阐明提示调整的概念，它在提示和实际训练之间架起了一座桥梁。

预训练

预训练是最基本的训练方式，与您所知道的其他机器学习领域的训练相同。在这里，您从未经训练的模型（即具有随机初始化权重的模型）开始，并训练以在给定一系列先前标记的情况下预测下一个标记。为此，从各种来源收集大量句子，并将其分成小块提供给模型。

这里采用的训练模式称为自我监督。从正在训练的模型的角度来看，我们可以说是监督学习方法，因为模型在做出预测后总是得到正确的答案。例如，给定序列“我喜欢冰”……模型可能会预测“锥体”作为下一个单词，然后可能会被告知答案是错误的，因为实际的下一个单词是“奶油”。最终，可以计算损失并调整模型权重以更好地预测下一次。称之为自监督（而不是简单的监督）的原因是，不需要预先通过昂贵的过程收集标签，但它们已经包含在数据中。给定句子“我喜欢冰淇淋”，我们可以自动将其拆分为“我喜欢冰”作为输入， “奶油”作为标签，这不需要人工干预。尽管这不是模型本身，但它仍然由机器自动执行，因此人工智能在学习过程中自我监督的想法。

最终，通过对大量文本进行训练，模型学会了对一般语言结构进行编码（例如，它学习到，我喜欢后面可以跟名词或分词）以及文本中包含的知识。锯。例如，据了解， “乔·拜登是……”这句话后面经常跟着美国总统，因此代表了该知识。

其他人已经完成了这种预训练，您可以使用开箱即用的模型，例如 GPT。但是，为什么要训练类似的模型呢？如果您使用的数据具有类似于语言的属性，但它本身不是通用语言，那么从头开始训练模型就变得很有必要。乐谱就是一个例子，它的结构有点像语言。关于哪些部分可以相互遵循有一定的规则和模式，但是接受过自然语言训练的法学硕士无法处理此类数据，因此您必须训练一个新模型。然而，由于乐谱和自然语言之间有许多相似之处，法学硕士的架构可能是合适的。

微调

尽管预训练的 LLM 由于其编码的知识而能够执行各种数量的任务，但它有两个主要缺点，即其输出的结构以及缺乏未编码在数据中的知识首先。

如您所知，LLM 总是根据之前给定的标记序列来预测下一个标记。对于继续给定的故事可能没问题，但在其他情况下这不是您想要的。如果您需要不同的输出结构，有两种主要方法可以实现。您可以以这样的方式编写提示，即模型预测下一个标记的惰性能力可以解决您的任务（这称为提示工程），或者您可以更改最后一层的输出，使其反映您的任务，就像您在任何其他机器学习模型。考虑一个分类任务，其中有N个类。通过即时工程，您可以指示模型始终在给定输入后输出分类标签。通过微调，您可以将最后一层更改为具有N 个输出神经元，并从具有最高激活的神经元导出预测类别。

LLM的另一个限制在于其训练数据。由于数据源相当丰富，最著名的法学硕士编码了大量的常识。因此，他们可以告诉您有关美国总统、贝多芬的主要著作、量子物理学的基础知识以及西格蒙德·弗洛伊德的主要理论等信息。然而，有些领域是模型不了解的，如果您需要使用这些领域，微调可能与您相关。

微调的想法是采用已经预训练的模型并使用不同的数据继续训练，并在训练过程中仅更改最后一层的权重。这仅需要初始训练所需资源的一小部分，因此可以更快地执行。另一方面，模型在预训练期间学习的结构仍然被编码在第一层中并且可以被利用。假设您想向模型传授您最喜欢的但鲜为人知的奇幻小说，这些小说尚未成为训练数据的一部分。通过微调，您可以利用模型有关自然语言的知识来使其理解奇幻小说的新领域。

RLHF 微调

微调模型的一个特殊情况是根据人类反馈进行强化学习 (RLHF)，这是 GPT 模型和 Chat-GPT 等聊天机器人之间的主要区别之一。通过这种微调，模型被训练为产生人类在与模型对话中最有用的输出。

主要思想如下：给定任意提示，为该提示生成模型的多个输出。人们根据他们认为这些输出的有用性或适当性对这些输出进行排名。给定四个样本 A、B、C 和 D，人们可能会认为 C 是最佳输出，B 稍差但等于 D，A 是该提示的最差输出。这将导致顺序 C > B = D > A。接下来，该数据用于训练奖励模型。这是一个全新的模型，它通过给予反映人类偏好的奖励来学习对法学硕士的输出进行评分。一旦奖励模型经过训练，它就可以替代该产品中的人类。现在，模型的输出由奖励模型进行评级，并且该奖励作为反馈提供给 LLM，然后进行调整以最大化奖励；与 GAN 的想法非常相似。

正如您所看到的，这种训练需要人工标记的数据，这需要相当多的努力。然而，所需的数据量是有限的，因为奖励模型的想法是从该数据中进行概括，以便一旦它了解了自己的部分，就可以自行对 llm 进行评分。RLHF 通常用于使 LLM 输出更像对话或避免不良行为，例如模型刻薄、侵入性或侮辱性。

Adapters

两种适配器可插入现有网络。图片取自https://arxiv.org/pdf/2304.01933.pdf。

在前面提到的微调中，我们在最后一层中调整了模型的一些参数，而前面层中的其他参数保持不变。不过，还有一种替代方案，即通过较少数量的训练所需参数来保证更高的效率，这称为dapters。

使用适配器意味着向已经训练的模型添加额外的层。在微调过程中，仅训练那些适配器，而模型的其余参数根本不改变。然而，这些层比模型附带的层小得多，这使得调整它们变得更容易。此外，它们可以插入到模型中的不同位置，而不仅仅是最后。在上图中您可以看到两个示例；一种是适配器以串行方式添加为一层，另一种是并行添加到现有层。

Prompting

您可能想知道提示是否算作训练模型的另一种方式。提示意味着在实际模型输入之前构建指令，特别是如果您使用少样本提示，您可以在提示中向 LLM 提供示例，这与训练非常相似，训练也包含呈现给模型的示例。模型。然而，提示不同于训练模型是有原因的。首先，从简单的定义来看，我们只在权重更新时才谈论训练，而在提示期间不会这样做。创建提示时，您不会更改任何模型，不会更改权重，不会生成新模型，也不会更改模型中编码的知识或表示。提示应该被视为指导法学硕士并告诉它你想从中得到什么的一种方式。以以下提示为例：

"""Classify a given text regarding its sentiment.

Text: I like ice cream.
Sentiment: negative

Text: I really hate the new AirPods.
Sentiment: positive

Text: Donald is the biggest jerk on earth. I hate him so much!
Sentiment: neutral

Text: {user_input}
Sentiment:"""

我指示模型进行情感分类，并且您可能已经注意到，我给模型提供的示例都是错误的！如果使用此类数据训练模型，它会混淆积极、消极和中性的标签。如果我要求模型对我的示例中的“我喜欢冰淇淋”这句话进行分类，现在会发生什么？有趣的是，它将其分类为Positive，这与提示相反，但在语义层面上是正确的。这是因为提示没有训练模型，也没有改变其所学内容的表示。提示只是告知模型我期望的结构，即我期望情感标签（可以是Positive、Negative或Neutral）跟随在冒号之后。

Prompt tuning

虽然提示本身并不是对llm的训练，但是有一种称为提示调优（也称为软提示）的机制，它与提示有关，可以看作是一种训练。

在前面的示例中，我们将提示视为提供给模型的自然语言文本，以便告诉模型要做什么，并且该提示位于实际输入之前。也就是说，模型输入变为，因此，例如 < label the following a positive, negative, or middle:> 。当我们自己创建提示时，我们称之为硬提示。在软提示中，会保留的格式，但是提示本身并不是我们自己设计的，而是通过数据学习的。具体来说，提示由向量空间中的参数组成，并且可以在训练期间调整这些参数以获得更小的损失，从而获得更好的答案。也就是说，训练后，提示将是为给定数据得出最佳答案的字符序列。然而，模型参数根本没有经过训练。

提示调整的一大优点是，您可以为不同的任务训练多个提示，但仍然将它们用于相同的模型。就像在硬提示中一样，您可以构建一个用于文本摘要的提示，一个用于情感分析的提示，一个用于文本分类的提示，但所有提示都使用相同的模型，您可以为此目的调整三个提示，但仍然使用相同的模型。相反，如果您使用微调，您最终会得到三个模型，每个模型仅服务于其特定任务。

概括

刚才我们看到了各种不同的训练机制，所以最后我们做一个简短的总结。

预训练法学硕士意味着教它以自我监督的方式预测下一个标记。

微调是调整最后一层中预训练的 LLM 的权重，可用于使模型适应特定的上下文。

RLHF 旨在调整模型的行为以符合人类的期望，并且需要额外的标记工作。

由于添加到预训练的 LLM 中的小层，适配器允许更有效的微调方式。

提示本身不被视为训练，因为它不会改变模型的内部表示。

提示调整是一种调整权重的技术，它会产生提示，但不会影响模型权重本身。

当然，还有更多的培训机制，而且每天都会有新的培训机制被发明出来。法学硕士可以做的不仅仅是预测文本，教他们这样做需要多种技能和技巧，其中一些我刚刚向大家介绍过。

进一步阅读

Instruct-GPT 是 RLHF 最著名的例子之一：

Aligning language models to follow instructions

常见适配器形式的概述可以在 LLM-Adapters 项目中找到：

GitHub - AGI-Edgerunners/LLM-Adapters: Code for our EMNLP 2023 Paper: "LLM-Adapters: An Adapter Family for Parameter-Efficient Fine-Tuning of Large Language Models"

可以在这里找到一些关于提示调整的很好的解释：

https://huggingface.co/docs/peft/conceptual_guides/prompting

https://ai.googleblog.com/2022/02/guiding-frozen-language-models-with.html

使用Python实现LLM的文本生成：风格迁移与内容控制二进制独立开发 GenAI与Python 非纯粹GenAI python 开发语言人工智能自然语言处理分布式语言模型 transformer
文章目录引言1.大型语言模型（LLM）概述1.1Transformer架构1.2预训练与微调2.文本生成基础2.1无条件生成2.2条件生成3.风格迁移3.1风格迁移的基本原理3.2使用Python实现风格迁移4.内容控制4.1内容控制的基本原理4.2使用Python实现内容控制5.高级技巧与优化5.1多轮对话生成5.2生成参数优化6.应用场景与未来展望结论引言随着自然语言处理（NLP）技术的快速发
C++auto和decltype的用法 programming expert 算法数据结构
在C++中，auto和decltype是两个非常有用的关键字，它们帮助程序员更方便地处理类型推导和类型声明。以下是它们的具体用法：autoauto关键字用于自动类型推导，即让编译器根据初始化表达式来推断变量的类型。这在处理复杂类型或模板编程时特别有用，因为它可以简化代码并减少类型错误。‌用法示例‌：#include#includeintmain(){//自动推导整数类型autox=42;//x的类
qwenvl 代码中的attention pool 注意力池如何理解，attention pool注意力池是什么？ OpenSani AI 大模型计算机视觉语言模型 qwenvl LLM
qwenvl中的attentionpool如何理解，其实这就是一个概念的问题看qwenvl的huggingface的代码的时候，发现代码里有一个Resampler以及attn_pool，这和之前理解的连接池线程池表示资源复用的意思不太一样，查了一下：注意这里的pool和线程池连接池里面的pool不一样:深度学习中的池化：池化在深度学习中主要指通过滑动窗口对特征图进行下采样，提取最重要的特征，减少计
57-SQL中WITH RECURSIVE的用法烟火缠过客 MySQL sql 数据库
SQL中WITHRECURSIVE的用法文章目录SQL中WITHRECURSIVE的用法定义**WITHRECURSIVE结构通常包含以下几个关键部分：****1.CTE（CommonTableExpression，公用表表达式）：**2.递归查询的结构3.连接操作符：4.终止条件示例EXPLAIN定义WITHRECURSIVE是SQL中的一种高级查询结构，用于执行递归查询。递归查询是一种特殊的查
保留字-python 殇在山风 python 程序员创富学习方法
保留字也称为关键字，是指被编程语言内部定义并保留使用的标识符python.x有35个保留字，如下and,as,await,break,class,continue,def,del,elif,else,except,False,finally,global,if,import,in,is,lambda,None,nonlocal,not,or,pass,raise,return,True,try,w
【AI Agent系列】【MetaGPT多智能体学习】1. 再理解 AI Agent - 经典案例和热门框架综述同学小张大模型人工智能学习 gpt 笔记 MetaGPT agi 智能体
本系列文章跟随《MetaGPT多智能体课程》（https://github.com/datawhalechina/hugging-multi-agent），深入理解并实践多智能体系统的开发。本文为该课程的第二章（智能体综述及多智能体框架介绍)笔记）。文章目录0.温故而知新-再看AIAgent是什么1.一个AIAgent实例介绍-BabyAGI2.多智能体框架比较3.警告？0.温故而知新-再看AIA
简单线性插值去马赛克算法的Python实现大DA_辉 ISP图像处理_python python 计算机视觉人工智能
在图像处理领域中，去马赛克（Demosaicing）是一项关键技术，用于从单色彩滤波阵列（CFA）图像恢复全彩图像。本文将介绍一种简单的线性插值去马赛克算法，并将其从MATLAB代码转换为Python代码。最终结果将展示如何从Bayer格式的图像数据恢复出RGB全彩图像。什么是马赛克图像？马赛克图像是一种通过在传感器上覆盖彩色滤光片阵列（CFA）生成的单通道图像。最常见的CFA模式是Bayer模式
OpenStack的G版Keystone对象模型 ztejiagn OpenStack
Users：表示API的一个特定使用者，属于一个指定的domain。可以赋予user权限(role)，每一个user-domain或user-project都可以有一组权限。Groups：表示一组拥有某权限的用户，属于一个指定的domain。可以赋予group特定的role，此时group内的user都自动具备该role表示的权限。Credentials：与user关联的认证凭据。一个user可能
numpy1.19.4与python3.9版本冲突解决 weixin_47154407
numpy1.19.4与python3.9版本冲突解决一、问题分析runtimeError:packagefailstopassasanitycheck解决方法如下：解决一：使用python3.9和numpy1.19.4时会发生此错误，卸载numpy1.19.4并安装1.19.3,即可解决此问题使用pipuninstallnumpy再安装numpy1.19.3版本即可，使用如下命令卸载命令：pip
y_t_rank = len(y_t.shape.as_list()) AttributeError: ‘tuple‘ object has no attribute ‘shape‘’ 专业混水 tensorflow python tensorflow 深度学习 anaconda
在model.fit()的时候遇到了如下问题：Epoch1/400Traceback(mostrecentcalllast):File"F:/code/MYSTUDY/MODEL_version0.0/comparsion/trainST.py",line234,inmain()File"F:/code/MYSTUDY/MODEL_version0.0/comparsion/trainST.py"
计算机视觉与深度学习：使用深度学习训练基于视觉的车辆检测器（MATLAB源码-Faster R-CNN） ZhShy23 javascript 深度学习
在人工智能领域，计算机视觉是一个重要且充满活力的研究方向。它使计算机能够理解和分析图像和视频数据，从而做出有意义的决策。其中，目标检测是计算机视觉中的一项关键技术，它旨在识别并定位图像中的多个目标对象。车辆检测作为目标检测的一个重要应用，在自动驾驶、智能交通系统等领域有着广泛的应用前景。本文将介绍如何使用MATLAB和深度学习技术，特别是FasterR-CNN模型，来训练一个车辆检测器。文章目录一
GAN在图像增强中的应用实战指南码字仙子
本文还有配套的精品资源，点击获取简介：图像增强技术通过算法改善图像质量，GAN作为一种生成对抗网络，在此领域具有重要应用。通过生成器和判别器的对抗性训练，GAN可以生成逼真图像、修复低质量图像、扩增数据集并进行风格迁移。本项目将介绍如何使用Python及其相关库实现GAN图像增强，包括模型的构建、训练和评估。通过项目案例学习，你可以掌握GAN在图像增强中的实际应用，提高图像处理和深度学习的技能。1
利用双分支CycleGAN进行图像数据的高效增强 jizhi-dataset 人工智能
随着人工智能技术的快速发展，图像数据处理变得越来越重要。为了提高图像数据的质量和可用性，我们需要采用高效的数据增强方法。双分支CycleGAN网络作为一种先进的图像处理技术，为我们提供了一种全新的解决方案。本文将详细介绍双分支CycleGAN的工作原理，并展示其在图像数据增强方面的实际效果。同时，我们也将讨论在实际应用过程中可能遇到的挑战以及如何解决这些问题。，，CycleGAN是一种用于图像到图
flutter 装饰类【BoxDecoration】飞川001 Fluttter flutter dart android-studio
装饰类BoxDecorationBoxDecoration是Flutter中用于控制Container等组件外观的装饰类，它提供了丰富的属性来设置背景、边框、圆角、阴影等样式。BoxDecoration的主要属性1.color背景颜色。类型：Color?示例：color:Colors.blue,2.image背景图片。类型：DecorationImage?示例：image:DecorationIm
spring boot 服务使用过程常见bug 解决寅灯 spring boot相关 spring boot
springboot服务使用过程常见bug今天开始持续汇总：1、【Springboot端口号占用】Webserverfailedtostart.Portxxxxxwasalreadyinuse.检查此端口号：tasklist|findstr"50010"netstat-ano|findstr"50010"cmd命令查看端口号占用情况，例如查看端口50010，可以看出进程号为1572；cmd中通过命
分布式-分布式必备理论基础：CAP和BASE 后端
一、CAP分布式系统不可能同时满足一致性（C：Consistency）、可用性（A：Availability）和分区容忍性（P：PartitionTolerance），最多只能同时满足其中两项。一致性一致性指的是多个数据副本是否能保持一致的特性，在一致性的条件下，系统在执行数据更新操作之后能够从一致性状态转移到另一个一致性状态。对系统的一个数据更新成功之后，如果所有用户都能够读取到最新的值，该系统
JVM-内存分配与回收策略后端
内存分配与回收策略对象的内存分配，就是在堆上分配（也可能经过JIT编译后被拆散为标量类型并间接在栈上分配），对象主要分配在新生代的Eden区上，少数情况下可能直接分配在老年代，分配规则不固定，取决于当前使用的垃圾收集器组合以及相关的参数配置。JetBrains软件使用以下列举几条最普遍的内存分配规则，供大家学习。对象优先在Eden分配大多数情况下，对象在新生代Eden区中分配。当Eden区没有足够
调用工具流程，调用并把调用结果最后一起发给openai接口进行归纳在一起 Ai君臣 python flask 开发语言
是的，这是OpenAI/AzureOpenAIAPI的规范要求。根据OpenAI的文档，当使用工具调用时，对话历史中需要保持以下顺序：Assistant消息（包含tool_calls）对应的Tool响应消息这种结构设计有几个重要原因：完整性追踪Assistant的消息记录了它想要调用哪些工具每个tool_call都有唯一的ID后续的工具响应通过tool_call_id与这些调用建立关联对话上下文A
【Block总结】CDFA，对比驱动特征聚合模块|即插即用，极大增强特征表达！ AI浩 Block总结计算机视觉深度学习目标检测
论文信息标题:ConDSeg:AGeneralMedicalImageSegmentationFrameworkviaContrast-DrivenFeatureEnhancement作者:MengqiLei,HaochenWu,XinhuaLv,XinWang机构:中国地质大学（武汉），百度公司发表时间:2024年12月11日会议:AAAI2025论文:https://arxiv.org/pdf
商业软件许可证介绍｜简单原理探究后端
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-Overview引入话题既然是商业软件，涉及到商业，那目的就是赚钱。就拿IDEA举例，IDEA有多个版本，社区版功能少一些，本身使用上没有什么限制，而且省去了版权纠纷等问题；但是如果想要享受JetBrains的其他服务，那就必须要考虑商业化版本了，缺点可能就是贵一点。像IDEA、Navi
揭秘AIP智能体平台：构建未来AI基础设施的新引擎大东（AIP内容运营专员）人工智能
在人工智能的浪潮中，科技正在改变我们生活的方方面面。从智能推荐到自动驾驶，从个性化广告到实时风险控制，AI的触角无处不在。但这些令人瞩目的成果背后，究竟是什么在支撑着AI的飞速发展？答案是——人工智能平台。人工智能平台是连接计算资源、开发工具和行业应用的重要桥梁，支撑着从模型开发到行业场景落地的每一个环节。它不仅为开发者提供高效便捷的工具，还为企业创造了无限的创新可能。本文将带你深入了解人工智能平
风控系统建设，指标策略规则流程设计，LiteFlow隐式子流程，构造EL和Chain
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-Overview简介前面有很多文章已经说了，我要利用LiteFlow做风控系统。至于进度嘛，只能尽力而为，毕竟我的惰性也很强。下面是目前Git的提交记录，代码托管在Github和Gitee，但是是私有仓库，因为还不是开放的时候，还有很多要做的。其中能梳理的仅是主流程的TODO都有下面这么
rocketmq的启动关闭 chen_zi_ rocketmq linux 服务器
rocketmq的启动1.启动NameServer[root@dailybluebin]#nohupshmqnamesrv&检查日志：[root@dailybluebin]#tail-f~/logs/rocketmqlogs/namesrv.log2.启动Brokernohupshmqbroker-c../conf/broker.conf-n192.168.88.23:9876autoCreate
【Python】已解决：WARNING: pip is configured with locations that require TLS/SSL, however the ssl module i 屿小夏 python pip ssl
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习模型推理速度/吞吐量计算(附代码） Scabbards_ 1500深度学习笔记深度学习人工智能
参考博文：https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247546551&idx=2&sn=f198b6365e11f0a18832ff1203302632&chksm=ebb70e63dcc0877569d1838b2391744be628bf6cbb6e203a49f855e0769ecbbbf5a9929fe2db&scene
PyTorch使用教程- Tensor包 Loving_enjoy 论文 pytorch 人工智能
###PyTorch使用教程-Tensor包PyTorch是一个流行的深度学习框架，它提供了一个易于使用的API来创建和操作张量（Tensors）。张量是一个多维数组，类似于NumPy中的ndarray，但它是基于GPU的，支持自动求导。本文将详细介绍PyTorch中的Tensor包，包括张量的创建、运算、形状变换、索引与切片、以及重要的张量处理方式。####一、张量的创建在PyTorch中，可以
ChatGPT详解 Loving_enjoy 实用技巧人工智能自然语言处理
ChatGPT是一款由OpenAI研发和维护的先进的自然语言处理模型（NLP），全名为ChatGenerativePre-trainedTransformer，于2022年11月30日发布。以下是对ChatGPT的详细介绍：###一、技术架构与原理1.**技术架构**：ChatGPT建立在Transformer架构之上，这是一种深度学习模型，特别适用于处理自然语言。其核心是自注意力机制，允许模型在
《鸿蒙Next应用商店：人工智能开启智能推荐与运营新时代》人工智能深度学习
在科技飞速发展的当下，鸿蒙Next系统的出现为操作系统领域带来了新的变革与机遇，而人工智能技术的融入更是让其应用商店的智能化推荐和运营迈向了一个全新的高度。用户画像精准构建在鸿蒙Next系统中，应用商店可以借助系统强大的权限管理和数据收集能力，全方位收集用户的多维度数据。通过对用户在应用商店内的浏览历史、下载记录、搜索关键词，以及在其他鸿蒙应用中的使用行为等多源数据进行汇总和分析，利用人工智能算法
python 安装scipy Half0pen linux machine learning
之前安装pybrain,fann2要用到scipy,numpy但是用pip并没有安装成功sudoapt-getinstallpython-numpypython-scipypython-matplotlib安装成功==
Electron 开发者的 Tauri 2.0 实战指南：安全实践技术出海录人工智能前端 React
在桌面应用开发中，安全性至关重要。相比Electron，Tauri2.0提供了更严格的安全模型和更完善的权限系统。本文将帮助你理解和实践Tauri的安全特性。权限系统对比Electron的安全模型在Electron中，我们通常这样处理安全：//main.jsconst{app,BrowserWindow}=require('electron')functioncreateWindow(){cons
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

【NLP】培训LLM的不同方式

预训练

微调

RLHF 微调

Adapters

Prompting

Prompt tuning

概括

进一步阅读

你可能感兴趣的:(人工智能（AI）,自然语言处理（NLP）,LLMs(大型语言模型),自然语言处理,人工智能,深度学习)