hanscalZheng

大规模语言模型--中文 LLaMA和Alpaca

中文LLaMA

尽管 LLaMA 和 Alpaca 在 NLP 领域取得了重大进展，它们在处理中文语言任务时，仍存在一些局限性。这些原始模型在字典中仅包含数百个中文 tokens (可以理解为单词)，导致编码和解码中文文本的效率受到了很大影响。

之前已经对原始 LLaMA 技术进行了深入解读， LLaMA 基于 transformer 结构进行了一些改进，比如预归一化、 SwiGLU 激活函数以及旋转embedding 。LLaMA 的参数总数在 7B 到 65B 之间。实验数据表明， LLaMA 在保持更小模型尺寸的同时，与其他的 LLM 相比(比如 GPT-3)，具有相当的竞争性。

LLaMA 在公开可用的语料库中预训练了 1T 到 1.4T 个 token，其中大部分数据是英文，因此 LLaMA 理解和生成中文的能力受到限制。为了解决这个问题，中文版的 LLaMA 在原始 LLaMA 模型的基础上，扩充了包含 20K 中文 token 的中文词典，提升了编码效率，从而提升了模型处理和生成中文文本的能力，增强了基础语义理解能力。

然而，直接在中文语料库上对 LLaMA 进行预训练也存在相应的挑战：

1、原始 LLaMA tokenizer 词汇表中只有不到一千个中文字符。虽然 LLaMA tokenizer 可以通过回退到字节来支持所有的中文字符，但这种回退策略会显著增加序列长度，同时会降低处理中文文本的效率。
2、字节 tokens 不仅用于表示中文字符，还用于表示其它 UTF-8 tokens，这使得字节 tokens 难以学习中文字符的语义含义。

为了解决这些问题，作者提出了以下两个解决方案来扩展 LLaMA tokenizer 中的中文词汇：

1、在中文语料库上使用 SentencePiece 训练一个中文tokenizer，使用 20000 个词汇大小。然后将中文tokenizer 与原始 LLaMA tokenizer 合并，通过组合它们的词汇表，最终获得一个合并的 tokenizer，称为中文 LLaMA tokenizer，词汇表大小为 49953。
2、为了使模型适应上一步产生的中文 LLaMA tokenizer，研究人员将 word embeddings 和语言模型的head 从 V × H 调整为 V’× H 的形状，其中 V = 32,000 代表原始词汇表的大小，而 V’ = 49,953 则是中文 LLaMA tokenizer 的词汇表大小。新行附加到原始嵌入矩阵的末尾，确保原始词汇表中的 token embedding 不受影响。

使用中文 LLaMA 分词器，相比于原始的 LLaMA 分词器，生成的 token 数减少了一半左右，原因是，前者的编码长度有了明显的减少，如下表所示。给定固定的上下文长度时，相比于原始 LLaMA 分词器，新模型可以容纳约两倍的信息，且生成速度快两倍。这表明，新模型在提高 LLaMA 模型的中文理解和生成能力方面是有效的。

原始 LLaMA 和中文 LLaMA 的 tokenizer 对比示例。

得到了中文 LLaMA 分词器后，研究人员使用中文 LLaMA 分词器，基于标准 Casual Language Modeling(CLM)

任务，对中文 LLaMA 模型进行预训练。对于给定的输出 token 序列： x = (x0 , x1 , x2 , ..., xi−1 )，模型使用自回归的方式训练，以预测下一个 token。目标即最小化负对数似然：

其中， xi 表示预测的 token；x0 , x1 , x2 , ..., xi−1 表示上下文。

采用 LoRA 的高效参数微调方法，在冻结原模型 LLaMA 参数的情况下，通过往模型中加入额外的网络层，并只训练这些新增的网络层参数。这种方法大大减少了总可训练参数，使得用更少的计算资源训练 LLaMA，LoRA 的原理其实并不复杂，它的核心思想是在原始预训练语言模型旁边增加一个旁路，做一个降维再升维的操作，来模拟所谓的 intrinsic rank (预训练模型在各类下游任务上泛化的过程其实就是在优化各类任务的公共低维本征 (low-dimensional intrinsic) 子空间中非常少量的几个自由参数)。为了在计算资源紧张的情况下实现参数高效的训练，作者将 LoRA 训练应用于论文中的所有中文 LLaMA 和 Alpaca 模型，包括预训练和微调阶段。

在训练时，固定预训练语言模型的参数，只训练降维矩阵 A 与升维矩阵 B。而模型的输入输出维度不变，输出时将 BA 与预训练语言模型的参数叠加。用随机高斯分布初始化 A，用 θ 矩阵初始化 B。这样能保证训练开始时，新增的通路 BA = θ 从，而对模型结果没有影响。

在推理时，将左右两部分的结果加到一起即可， h = Wx + BAx = (W + BA)x，所以，只要将训练完成的矩阵乘积 BA 跟原本的权重矩阵 W 加到一起作为新权重参数替换原始预训练语言模型的 W 即可，不会增加额外的计算资源。

Tokenizer

LLaMA 的训练语料以英文为主，使用字节对编码(BPE) 算法对数据进行分词，使用 SentencePiece 的实现，词表大小只有 32000。词表里的中文 token 很少，只有几百个，预训练中没有出现过或者出现得很少的语言学习得不充分，而且，对中文分词的编码效率比较低。值得注意的是，作者将所有数字分割成单个数字。

讲解 SentencePiece 之前，我们先讲解下分词器(Tokenizer)。简单点说分词器就是将字符序列转化为数字序列，对应模型的输入。通常情况下， Tokenizer 有三种粒度： word/char/subword，这三种粒度分词截然不同，各有利弊：

1. word: 按照词进行分词，如: Today is sunday. 则根据空格或标点进行分割 [today, is, sunday, .]，对于 word 粒度分词，其优点是词的边界和含义得到保留；缺点是： 1) 词表大，稀有词学不好； 2 ) OOV (可能超出词表外的词)； 3) 无法处理单词形态关系和词缀关系，会将两个本身意思一致的词分成两个毫不相同的 ID，在英文中尤为明显，如： cat ，cats。
2. character：按照单字符进行分词，就是以 char 为最小粒度。如： Today is sunday. 则会分割成 [t，o，d，a，y， .... ，s，u，n ，d ，a，y ，.]，对于 character 粒度分词，其优点是词表极小，比如： 26 个英文字母几乎可以组合出所有词， 5000 多个中文常用字基本也能组合出足够的词汇；缺点是： 1) 无法承载丰富的语义，英文中尤为明显，但中文却是较为合理，中文中用此种方式较多。 2)序列长度大幅增长；
3. subword：按照词的 subword 进行分词。如： Today is sunday. 则会分割成 [to，day，is ，s，un，day ，.]，为了平衡以上两种方法，提出了基于 subword 进行分词：它可以较好的平衡词表大小与语义表达能力；常见的子词算法有 Byte-Pair Encoding (BPE) / Byte-level BPE (BBPE )、WordPiece 、SentencePiece 等。

BPE 和 BBPE ： BPE 即字节对编码。其核心思想是从字母开始，不断找词频最高、且连续的两个 token 合并，直到达到目标词数。 BBPE：BBPE 核心思想将 BPE 的从字符级别扩展到子节(Byte) 级别。 BPE 的一个问题是如果遇到了 unicode 编码，基本字符集可能会很大。 BBPE 就是以一个字节为一种“字符”，不管实际字符集用了几个字节来表示一个字符。这样的话，基础字符集的大小就锁定在了 256 (28 )。采用 BBPE 的好处是可以跨语言共用词表，显著压缩词表的大小。而坏处就是，对于类似中文这样的语言，一段文字的序列长度会显著增长。因此， BBPE based 模型可能比 BPE based 模型表现的更好。然而， BBPE sequence 比起 BPE 来说略长，这也导致了更长的训练/推理时间。 BBPE 其实与 BPE 在实现上并无大的不同，只不过基础词表使用256 的字节集。

WordPiece ： WordPiece 算法可以看作是 BPE 的变种。不同的是， WordPiece 基于概率生成新的 subword 而不是下一最高频字节对。 WordPiece 算法也是每次从词表中选出两个子词合并成新的子词。 BPE 选择频数最高的相邻子词合并，而 WordPiece 选择使得语言模型概率最大的相邻子词加入词表。

SentencePiece ： SentencePiece 它是谷歌推出的子词开源工具包，它是把一个句子看作一个整体，再拆成片段，而没有保留天然的词语的概念。一般地，它把空格也当作一种特殊字符来处理，再用 BPE 或者 Unigram 算法来构造词汇表。 SentencePiece 除了集成了 BPE、ULM 子词算法之外， SentencePiece 还能支持字符和词级别的分词。当前主流的一些开源大模型有很多基于 BBPE 算法使用 SentencePiece 实现分词器，下面来讲解 SentencePiece 工具的具体使用。

SentencePiece 是一种无监督的文本 tokenizer 和detokenizer ，主要用于基于神经网络的文本生成系统，其中，词汇量在神经网络模型训练之前就已经预先确定了。SentencePiece 实现了 subword 单元(例如，字节对编码 (BPE)) 和 unigram 语言模型)，并可以直接从原始句子训练字词模型 (subword model)。这使得我们可以制作一个不依赖于特定语言的预处理和后处理的纯粹的端到端系统。 SentencePiece 特性如下：

Token 数量是预先确定的: 神经网络机器翻译模型通常使用固定的词汇表进行操作。与大多数假设无限词汇量的无监督分词算法不同， SentencePiece 在训练分词模型时，使最终的词汇表大小固定，例如： 8k 、16k 或 32k。
从原始句子进行训练: 以前的子词(sub-word) 实现假设输入句子是预标记(pre-tokenized) 的。这种约束是有效训练所必需的，但由于我们必须提前运行依赖于语言的分词器，因此使预处理变得复杂。 SentencePiece 的实现速度足够快，可以从原始句子训练模型。这对于训练中文和日文的 tokenizer 和 detokenizer 很有用，因为在这些词之间不存在明确的空格。
空格被视为基本符号: 自然语言处理的第一步是文本 tokenization, 例如，标准的英语分词器(tokenizer) 将对文本 Hello world 进行分段。分为 [Hello] [World] [.] 这三个 token。这种情况将导致原始输入和标记化 (tokenized) 序列不可逆转换。例如， “World”和“. ”之间没有空格的信息。空格将从标记化序列中删除，例如:Tokenize( “World. ”) == Tokenize( “World . ”)。但是， SentencePiece 将输入文本视为一系列 Unicode 字符。空格也作为普通符号处理。为了明确地将空格作为基本标记处理， SentencePiece 首先使用元符号”ff” (U+2581) 转义空格。 HelloffWorld. 然后，将这段文本分割成小块，例如： [Hello] [ffWor] [ld] [.]。由于空格保留在分段文本中，我们可以毫无歧义地对文本进行 detokenize 。detokenized = ”.join(pieces).replace(’ ’, ’ ’)，此特性可以在不依赖特定于语言的资源的情况下执行 detokenization。
子词正则化和 BPE-dropout: 子词正则化和 BPE-dropout 是简单的正则化方法，它们实际上通过实时子词采样来增强训练数据，这有助于提高神经网络机器翻译(NMT)模型的准确性和鲁棒性。

中文 LLaMA 经过词表扩充后，我们来对比一下几个基座模型 Tokenizer 的区别，如下表所示：

基座模型的 tokenizer 对比示例

“中文平均 token 数”表示了 tokenizer 分词后，每个中文字符对应的平均 token 数。从结果来看：

LLaMA 的词表是最小的， LLaMA 在中英文上的平均 token 数都是最多的，这意味着 LLaMA 对中英文分词都会比较碎，比较细粒度。尤其在中文上平均 token 数高达 1.45，这意味着 LLaMA 大概率会将中文字符切分为 2 个以上的token。
中文 LLaMA(Chinese LLaMA) 扩展词表后，中文平均 token 数显著降低，会将一个汉字或两个汉字切分为一个 token ，提高了中文编码效率。
ChatGLM-6B 是平衡中英文分词效果最好的tokenizer 。由于词表比较大，中文处理时间也有增加。
BLOOM 虽然是词表最大的，但由于是多语种的，在中英文上分词效率与 ChatGLM-6B 基本相当。需要注意的是， BLOOM 的 tokenizer 用了 transformers 的 BloomTokenizerFast 实现，分词速度更快。

从一个例子来直观对比不同 tokenizer 的分词结果。“男儿何不带吴钩，收取关山五十州。”共有 16 字。几个 tokenizer 的分词结果如下：

LLaMA 分词为 24 个 token ：[ ’ 男’, ’<0xE5>’, ’<0x84>’, ’<0xBF>’, ’ 何’, ’ 不’, ’<0xE5>’, ’<0xB8>’, ’<0xA6>’, ’<0xE5>’, ’<0x90>’, ’<0xB4>’, ’<0xE9>’, ’<0x92>’, ’<0xA9>’, ’，’, ’ 收’, ’ 取’, ’ 关’, ’ 山’, ’ 五’, ’ 十’, ’ 州’, ’。’]
Chinese LLaMA 分词为 14 个 token ：[ ’ 男’, ’ 儿’, ’ 何’, ’ 不’, ’ 带’, ’ 吴’, ’ 钩’, ’ ，’, ’ 收取’, ’ 关’, ’ 山’, ’ 五十’, ’ 州’, ’。 ’]
ChatGLM-6B 分词为 11 个 token ：[ ’ 男儿’, ’ 何不’, ’ 带’, ’ 吴’, ’ 钩’, ’,’, ’ 收取’, ’ 关山’, ’ 五十’, ’ 州’, ’。 ’]
Bloom 分词为 13 个 token ：[’ 男’, ’ 儿’, ’ 何不’, ’ 带’, ’ 吴’, ’ 钩’, ’ ，’, ’ 收取’, ’ 关’, ’ 山’, ’ 五十’, ’ 州’, ’。 ’]

中文 Alpaca

在获得了预训练的中文 LLaMA 模型后，作者利用斯坦福羊驼(Alpaca) 训练采用的方法——指令微调继续训练该模型，得到一个遵循指令的 LLaMA 模型—— 中文 Alpaca。继斯坦福羊驼(Stanford Alpaca) 之后， UC 伯克利、 CMU、斯坦福等机构的学者，联手发布了最新开源大模型骆马(Vicuna)，包含 7B 和 13B 参数。我们已经清楚 ChatGPT 的训练步骤，可以借鉴 ChatGPT 的训练步骤，得到一个类 ChatGPT 大模型，下面以 Alpaca 为例介绍：

第一步：收集标注数据(人工标注的 prompt + 期望回答)，在已有的大语言模型基础上(GPT3 、GPT-3.5、 ChatGPT)，进行有监督训练，得到“模型 A ”。
第二步：收集对比数据。给定一个 prompt，第一步的模型会产生多个输出，标注人员会对这些输出答案进行排序，训练一个 pairwise 模型(Reward 模型)，即“模型 B”，模型 B 与模型 A 的模型结构不同。
第三步：基于第一步、第二步的模型，基于 PPO 强化学习算法，训练得到最终模型，即“模型 C”，模型 C 与模型 A 的结构相同。

因此，在类 ChatGPT 大模型的训练过程中，为了进行第一步的训练，目前通常使用 OPT 、BLOOM 、GPT- J、LLaMA 等开源大模型替代 GPT3 、GPT3.5 等未开源的模型。 Stanford Alpaca 提供了基于“指令遵循数据”对 LLAMA 进行微调(supervised finetuning)的代码，完成了“类 ChatGPT 大模型训练步骤”中的第一步。

Alpaca 7B 是由 Meta 的 LLaMA 7B 模型通过 52K 指令微调得到的模型。 Alpaca 与 OpenAI 的text-davinci-003 (GPT-3.5)表现类似，模型容量惊人的小，易于复现，且复现成本低(<600 美元)。

GPT-3.5 (text-davinci-003) ，ChatGPT ，Claude 和 Bing Chat 等指令遵循模型的功能越来越强大。许多用户定期与这些模型进行交互，且在工作中使用它们。尽管这些模型得到了广泛部署，但它们仍有许多不足之处：产生虚假信息、传播社会偏见、甚至制造有毒言论。

为了解决这些紧迫问题，学术界的参与至关重要。不幸的是，在学术界进行指令遵循研究十分困难，因为没有一个易于实现的模型可以在功能上接近于 closed-source (未开源)模型(比如 OpenAI 的 GPT-3.5 )。

文章提到， Alpaca 小羊驼仅用于学术研究，禁止任何商业用途。原因有三： 1 、Alpaca 基于 LLaMA，它有非商业许可证，因此 Alpaca 也必须继承这一点； 2、指令数据基于 OpenAI 的 text-davinci-003，其使用条款禁止开发与 OpenAI 竞争的模型； 3 、没有设计足够的安全措施，因此羊驼还未准备好作为一般用途。

训练方法

在学术预算下，训练高质量的指令遵循模型具有两个挑战， 1) 一个强大的预训练语言模型； 2) 高质量的指令遵循数据。 Meta 最新发布的 LLaMA 模型解决了第一个挑战。对于第二个挑战，根据 self-instruct 论文的介绍，可以使用现有的强大语言模型，自动生成指令数据。 Alpaca 正是由LLaMA 7B 模型经过有监督微调结合由OpenAI 的 GPT-3.5 生成的 52K 指令数据训练而来。

下图说明了羊驼模型的训练方法。首先，从 self-instruct 种子集合中生成 175 个由人类撰写的指令-输出 pair 对。然后提示 text-davinci-003 使用上下文实例中的种子集合，生成更多的指令。通过简化生成过程，对 self-instruct 方法进行了改进，显著降低了成本。上述的数据生产过程产生了 52K 条独特的指令及其对应的输出，使用OpenAI 的 API，花费不足 500 美元。

Alpaca的训练示例

得到了这个指令遵循数据集后，利用全分片数据并行和混合精度训练等技术，基于 Hugging Face 的训练框架，对 LLaMA 模型进行微调。在首次运行中，在 8 个 80GB A100 显卡上微调 LLaMA-7B 模型，耗时 3 小时，这在大多数云计算供应商上的花费不足 100 美元。

评估和局限

在 self-instruct 评估集合上，对 Alpaca 进行人类评估。 self-instruct 评估集合由 self-instruct 的作者收集，涵盖了一系列面向用户的指令，包括电子邮件写作、社交媒体、生产力工具。作者对 text-davinci-003 和 Alpaca 7B 进行了比较，发现两个模型的性能非常相近： Alpaca 在与text-davinci-003 的比较中，赢得了 90 胜，而text-davinci-003 赢得了 89 胜。

文章里也提到了 Alpaca 的一些局限性，包括幻觉、毒性以及偏见。幻觉似乎是羊驼的常见出错模式。

ps: 欢迎扫码关注公众号^_^.

睡眠不足的危害 Ly1102
1.影响大脑的创造性思维科研人员研究认为，人的大脑要思维清晰、反应灵敏，必须要有充足的睡眠，如果长期睡眠不足，大脑得不到充分的休息，就会影响大脑的创造性思维和处理事物的能力。2.影响青少年的生长发育青少年的生长发育除了遗传、营养、锻炼等因素外，还与生长素的分泌有一定关系。生长素是下丘脑分泌和一种激素，它能促进骨骼、肌肉、脏器的发育。由于生长素的分泌与睡眠密切相关，即在人熟睡后有一个大的分泌高峰，随
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
AI推演人类进化：计算人类学与基因仿真的融合革命
AI推演人类进化：计算人类学与基因仿真的融合革命引言：数字达尔文主义的新纪元“进化不是直线，而是亿万次迭代的多元宇宙”——李·克罗宁（计算化学家）当AlphaFold解开蛋白质折叠之谜，AI开始重构生命演化的底层逻辑。本文通过多智能体仿真、古基因组重建与文化演化建模三大技术支柱，揭示AI如何推演人类从南方古猿到智人的百万年征程，并预测未来千年的进化轨迹。一、进化动力学的基础模型1.1扩展的哈迪-温
MCP协议技术解析：AI时代的通信基础设施革命
MCP协议技术解析：AI时代的通信基础设施革命在AI从工具演变为协作伙伴的进程中，MCP协议正在成为连接智能体与现实世界的“数字神经系统”。当前人工智能技术正经历从孤立模型向生态系统协作的关键转型，而通信协议作为AI能力的“连接器”，其设计直接决定了智能系统的边界与效率。MCP协议（ModelContextProtocol）作为新一代AI通信基础设施，正在开发者社区引发一场静默革命。本文将从技术原
金窝银窝不如自己的狗窝阿水兰
说个很真实的故事吧姑娘A和姑娘B是同学一直同学了六年从小学到初中其实两个都长得差不多很普通不算漂亮也不算丑初中毕业后姑娘A读了职高然后开始恋爱姑娘B.读普通高中也不是重点高中当时姑娘a还私下里觉得姑娘b可怜长那么大还没有人追十八岁之后姑娘a打了份文员工作姑娘B上了大学也不是很好的大学姑娘a打工期间与富二代恋爱了不久还奉子成婚恰好是暑假姑娘b去喝喜酒了富二代家确实有钱房子三套车好几辆姑娘a悄悄问b有
IO多路复用 04aaaze 服务器运维
一.构建tcp并发服务器单循环服务器：服务器同一时刻只能响应一个客户端的请求并发服务器：服务器在同一时刻可以响应多个客户端的请求构建TCP并发服务器：让TCP服务端具备同时响应多个客户端的能力。1.多进程资源消耗大，同资源平台下，并发量小。2.多线程创建线程、进程，比较耗时3.线程池提前预创建大量线程，避免任务执行过程中创建线程的耗时4.IO多路复用在不创建新的进程和线程的前提下，可以在一个进程中
好文章的5大标准，在这里，请围观如沐芳华
李笑来说过:审美常常并不需要知道原理，但创造美的人必须有方法论，否则不可能持续创造。写作就是一种创造活动，我们的文字能否被读者认可，就取决于文章内容。那什么样的文章算是好文章呢？粥左罗在《学会写作》这本书中提供了5个标准。（1）提供新知，创造价值写作不是自嗨，要让读者读完后有收获，读者能从你的文字中得到完善。优秀的文章提供的不局限于新知识，而且可以是新方法、新资料、新故事、新视角等。粥左罗有一篇被
2023-02-28仿写淡定的胡萝卜
原文：苏轼有言：“君子之所取者远，则必有所待；所就者大，则必有所忍。”一个人能吞下多少委屈，就能成就多大的功业。古往今来，真正的强者，无不能“忍”。人生一世间，不会万事顺遂，不可随心所欲，历经忍耐酸楚的过程，才能收获甜蜜的果实。元代学者吴亮与许名奎总结人生经验，著成《忍经·劝忍百箴》，旨在告诉世人“忍百忍者，百福之源”。人生不怕百个忍，人生只怕一不忍。忍，不是懦弱，不是退缩，而是一种以退为进的通达
有个人沉淀的石头
从前有个小孩儿，打小就跟父母务工在外。去过上海，待过浙江，更是在河北生活十几年。于老家的记忆，只是一些泥泞的路，破瓦的房，还有印象模糊的几个老人。他在河北，因为口音上的差异，不愿意与当地人说话，不愿意上学，直到9岁才上了一年级，这也导致了要比同年级同学大上两岁。他后来学习很好，小学到初中，一直都是班级前三名。老师们喜欢，同学们喜欢，也一直是父母的骄傲。一路顺风顺雨，过多的溢美之词形成了强烈自尊心与
中和（例二）玄空的北
乾造：己酉，丙子，癸未，戊午大运：乙亥，甲戌，癸酉，壬申，辛未，庚午。图片发自App此王观察造，癸日子月，似乎旺相，不知财杀太重，旺中变弱，局中无木，混浊不清，阴内阳外之象。月透财星，其心意必欲爱之；时逢官杀，其心志必欲合之。所以权谋异众，才干过人，出生末微，心术不端。癸酉得逢际遇，由佐二至观察，奢华逢迎，无出其右；至未运不能免祸，所谓欲不除，似蛾扑灯，焚身乃止，如猩嗜酒，鞭血方休。图片发自App
翻转木马程序3：艳平思语
2022.7.1503.我做什么都没有用。一切快乐都会结束，盛宴必散。刚刚我看到群里我二弟发的一段跟母亲说的话，我的泪水止不住往外冒。他想我妈妈了，我也想我妈妈了。“再过两天就是母亲的祭日了，现在家中是喜事连连是喜是忧心中感慨万千。母亲：您的二孙女去年考上了大学；您的外甥女今年已经当上了妈妈，小乐乐长得非常可爱；您的大孙女今年研究生也毕业了并且顺利找到了工作；您的外甥今年也考上了大学；您的三孙女也
我的第一届之高三未完成布丁孙娟
4班的孩子们高中毕业N年后同学会，把老师们也请了过去，我是其中的一位。大家玩了一个最尴尬的游戏——猜猜我是谁，让我说出他们的名字。我觉得这个游戏太尬了，猜对了情理之中，猜不对两败俱伤。唉，硬着头皮玩下去，可是我竟几乎说对了所有人的名字。这是怎么一回事？！因为……我和他们高中的缘分在高三那年未画上圆满的句号。未完成，在我这里就永远没有结束。那是第一次带高三，领导怕我压力大，把我的4班交给一个经验丰富
小表妹的前半生走心的小姐姐
小表妹毕业以后没多久就恋爱了，男票是一位没啥固定工作的人。当时家里的人极力反对，亲戚朋友多方劝阻，但是没用，小表妹毅然决然的要选择她心目中的所谓爱情。小表妹出生也是农村家庭，家庭并不富裕，但是有一对勤劳且疼爱她的父母，还有一起长大的弟弟，从小到大也算是长在蜜罐里不识愁滋味的一位姑娘啦。读书成绩也还可以，一路飙升到中专毕业踏入社会之中。父母：你工作赚钱，自己够花就可以！小表妹：那我就找一份自己喜欢的
GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习语言模型人工智能自然语言处理深度学习机器学习计算机视觉
GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型（LLMs）与复杂的人类价值观（如乐于助人和诚实）对齐，仍然是人工智能发展中的一个核心挑战。这项任务的主要范式是来自人类反馈的强化学习（RLHF）[Christianoetal.,2017;Baietal.,
贝融助手是什么？贝融助手是专业的大数据信用查询平台无忧达人
贝融助手是一个可以快速了解自己信用的工具，是一个生活中非常实用的小助手，信用是现在最重要的一个生活场景，人人都想有一个好的信用，贝融助手就是帮助我们查询自己信用的平台。贝融助手是一个非常专业的平台，贝融助手18年就上线了，到现在已经有很多年的历史了，在信用行业一直都是行业前三的平台，用户量也是非常的大，身边朋友都在用的平台。贝融助手查询入口放在文末了，划到文章结尾就可以看到查询入口贝融助手大数据信
谈忠言逆耳 ba020349304b
有云:“良药苦口利于病，忠言逆耳利于行”，这句话不难理解，讲的就是真正对一个人好的东西，往往不那么容易被人接受。国人生病不喜中药喜西药，很大一个原因就是中药味苦而涩，气大而足，需要捏着鼻子一口气灌下去；西药多为颗粒，胶囊，无气无味，外表甚至包有一层糖衣，温水冲服即可。(当然，此例并不十分恰当，中药和西药都是良药)古代的皇帝多宠奸臣而恨忠臣，非因其不识忠奸，而是因为忠臣总是摆出“陛下，要以江山社稷为
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
高省邀请码怎么弄小心掉坑高省邀请码到底哪个是官方的凌风导师
高省邀请码怎么弄小心掉坑高省邀请码到底哪个是官方的因为高省必要生长必要推广。网上一大批约请码那是再正常不外的了，高省约请码怎么得到？用户必要有约请码才气进入这款软件。而且是布衣化的推广.议决孤单联系关系登岸.高省-各大应用商城下载即可-购物领劵返利高，邀请码切记填999777，凌风高省邀请码999777，全网唯一教你技术的老师码填对码直送2皇冠总裁等级，《凌风导师V:125130414》送价值百万
十大直播培训机构，一起来看看糖葫芦很甜
市场上涌现出了一大批专业的直播培训机构，它们以各自独特的优势，助力学员在直播领域脱颖而出。5星公会，免费加入，一对一指导扶持↓微信在文章底部。苏晟传媒核心竞争力：苏晟传媒直播培训中心注重个性化教学，为每位学员量身定制学习方案。通过小班授课、一对一指导等形式，精准解决学员在直播过程中遇到的问题，加速成长进程。此外，中心还与多家电商平台合作，为优秀学员提供直播带货机会。创新理念：未来直播教育秉承“科技
时间不够用的周一珙桐花的话
感觉很多时候都会觉得计划赶不上变化。今天周一本来计划要把作业改完卷子讲四章最后卷子只讲了两张作业也没有改。今天上午上课的情绪也不太好，总是感觉说不出的烦躁。想答也没有什么大的烦心事儿但是看到学生表现不太好情绪就有点不稳定。又何必呢？可能是这两天看书太少了或者说看的书跟教学无关就又忘了如何去管理情绪吧。中午回家把给孩子们买的糖拿到班里了下午一人发了一个组长一人两个。本意是去感谢一下孩子们平常总是给我
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
哪里买书好？安然书d
哪里买书好？安然书近日书名A中少/植物大战僵尸2人体漫画-超级病菌大对抗(28元)给孩子的历史人物故事：足智多谋办法多给孩子的历史人物故事：我可以改变世界给孩子的历史人物故事：细节观察我在行A长江/怪物传说·龙和大蛇A社科/林秀穗情绪管理故事书·飞天小魔女2A社科/林秀穗情绪管理故事书·飞天小魔女1A社科/林秀穗情绪管理故事书·飞天小魔女3什么是什么·珍藏版（第2辑）：爬行与两栖动物什么是什么·珍
UFS4.0 协议之简介思无邪呢 UFS UFS 存储技术 JESD220F
通用闪存存储（UFS）是一种基于串行接口的简单、高性能大容量存储设备，主要用于移动系统的主机处理器与大容量存储设备之间的交互。以下是UFS设备的核心特性概述：4.1通用特性目标性能高速档位（GEARs）必须支持GEAR1至GEAR5的所有档位。目标主机应用手机、超便携个人电脑（UMPC）、数码静态相机（DSC）、便携式媒体播放器（PMP）、MP3播放器等需要大容量存储、可启动存储或外部卡的设备。目
给内在小孩的信喜欢书写的心理咨询师
亲爱的小英我爱你！我看到你了，我看到你那么爱学习，可是家里却总是打击你，数落你，我看到你的委屈难过和伤心。我特别心疼你，我特别想帮助你，因为我看到你你那么爱学习，那么懂事，我多么想把你抱在怀里好好爱你啊！我多想好好爱你，告诉你，你是那么宝贵你是那样珍贵，我是多么爱你(ɔˆ³(ˆ⌣ˆc)你多么值得被爱，你值得拥有美好的一切！我爱你！永远爱你！我爱你，我爱你，我爱你！我爱你，我永远爱你！爱你的大艳春亲
蚁淘生活APP优惠返佣平台邀请码日常购物技巧呀
蚁淘生活，高佣才是硬道理。蚁淘生活APP，是一款导购优惠返佣平台，自购轻松省，分享简单赚。海量特惠商品，各大电商平台购物具有高额返佣；千万宝妈的选择，更多人选择，更值得信赖；高额返佣金，佣金高至98%，月入上万不是梦；大咖带你赚佣金，精英聚集，定时与你分享成功经验。至于我为何从蚁淘生活有品转到高省呢，当然是高省佣金更高，模式更好。【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，
《红楼春趣》教学反思 7920d3e9d0bd
本文选自《红楼梦》第七十回，课文集中描写了宝玉和一众姊妹放风筝的场景。此时，众人重新起社填词，正热闹间，有人发现一个大蝴蝶风筝挂在竹梢上，这一场意外倒勾起大家放风筝的兴致来，于是大蝴蝶风筝、美人儿风筝、沙雁风筝、软翅子大凤凰风筝、大蝙蝠风筝、七个大雁风筝等纷纷粉墨登场，宝玉和一众姊妹个个尽显情趣。我教学时以文章题眼“趣”为突破口导出教学思路，先默读课文，想想故事的起因、经过、结果，再用自己的话讲讲
高建忠.读方用方笔记（一二七）临证谈小柴胡汤火帝养生
我们前面讨论了小柴胡汤治疗表证，现在来讨论小柴胡汤治疗里证，其实道理是一样的。在和解的基础上治疗表证，那么在和解的基础上治疗里证这也是一大法。李某，男，9岁。6月3日初诊。发热2天，下午及晚上较甚，呈持续性发热，纳食减少，不大便，有咽痛、口干，无恶寒，口不苦。舌质红，舌苔黄腻，脉弦数。这个九岁的孩子，发烧两天了，上午比较轻，下午和晚上比较重，吃饭也不怎么好，也不大便，口干，口不苦，有咽痛，也不恶寒
快手满减券每天几点刷新快手跨店优惠券怎么领直返APP淘客项目
快手购物新攻略：揭秘满减券刷新时间与跨店优惠券领取秘籍，直返APP让优惠触手可及在快节奏的现代生活中，快手不仅是我们休闲娱乐的好伙伴，更是便捷购物的理想平台。快手商城汇聚了众多优质商品，更有一系列优惠券和满减福利等待着您的发现。今天，就让我们一起探索快手优惠券的奥秘，特别是如何利用直返APP的优势，轻松领取每日刷新的满减券和跨店优惠券，让您的每一笔消费都物超所值。快手满减券刷新时间大揭秘想要抓住优
骗子太猖獗了，打着摩根士丹利何晓斌名义带股民进入虚假宝丰能源节能减排碳交易市场，大量股民被骗真相曝光墨守成法
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！这些新平台打着“低风险”、“高收益”、“慈善公益投票”等噱头先让投资人尝到甜头再通过恶意操作将投资人
莆田鞋与正品鞋有区别吗？七大区别让你一眼辨真伪！可爱的调皮捣蛋鬼
莆田鞋与正品鞋有区别吗？七大区别让你一眼辨真伪！莆田鞋与正品之间存在显著的区别，这些区别涵盖了质量、价格、品牌、生产工艺、细节处理等多个方面。以下是七大主要区别，帮助消费者一眼辨真伪：给大家推荐一个专门做顶级纯原莆田鞋的良心商家:小帅潮鞋，文章最后会给大家留老板的联系方式！！！1.质量与材质正品：通常采用优质材料，如天然皮革、耐磨橡胶等，确保鞋子的耐用性和舒适度。正品鞋的做工精细，无论是鞋面的缝合
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发