愤怒的可乐

[论文笔记]GPT-2

引言

今天继续GPT系列论文，这次是Language Models are Unsupervised Multitask Learners，即GPT-2，中文题目的意思是语言模型是无监督多任务学习器。

自然语言任务，比如问答、机器翻译、阅读理解和摘要，是在任务相关数据集上利用监督学习的典型方法。作者展示了语言模型在训练名为WebText的新数据集时，即使是无监督，也能开始学习这些任务。基于一个文档和问题的情况下，语言模型生成的回答在CoQA数据集上达到了55 F1得分，超过了4个基准系统中的3个，是在没有利用剩下127000+个训练样本的情况下。

语言模型的容量对于零样本任务成功迁移至关重要，并且以对数线性的方式提高任务之间的性能。最大的GPT-2模型是一个1.5B参数的Transformer，在零样本设定下载8个测试语言模型数据集中的7个达到了SOTA结果。

总体介绍

如今，机器学习系统通过使用大量数据集、高容量模型和监督学习组合的方式，在其训练任务上表现出色。然而，这些系统对数据分布的细微变化和任务规范非常脆弱和敏感。当前的系统更适合被描述为精通单一任务的专家，而不是可以胜任各种任务的万事通。

作者怀疑在单一领域数据集上进行单一任务训练的流行是当前系统泛化能力不足的一个主要原因。在当前架构下，朝着健壮系统的进展可能需要在各种领域和任务上进行训练和性能测量。

多任务学习是提高整体性能的一个有潜力的框架。然而，在自然语言处理领域，多任务训练仍处于初级阶段。

目前在语言任务上表现最好的系统利用了预训练和监督下微调的组合。但这些方法仍然需要监督训练才能执行任务，当只有最少或没有监督数据可用时，另一条研究线路展示了语言模型在执行特定任务(如常识推理)和情感分析方面的潜力。

在本篇工作中，作者连接了这两条研究线路，并扩展了更通用的转移方法的趋势。展示了语言模型可以在零样本设定中执行下游任务，无需任何参数或架构修改。通过突出语言模型在零样本设定中执行各种任务的能力来展示这种方法的潜力。

方法

作者方法的核心就是语言建模。语言建模通常被看成是从一组样本 $(x_1,x_2,\cdots,x_n)$ 中无监督地估计概率分布，其中每个样本由变长符号序列 $(s_1,s_2,\cdots,s_n)$ 组成。由于语言具有天然的顺序性，常常将符号的联合概率分解为条件概率的乘积：
$\prod_{i=1}^n p(s_n|s_1,\cdots,s_{n-1}) \tag 1$
这种方法允许从形如 $p(s_{n-k},\cdots,s_n|s_1,\cdots,s_{n-k-1})$ 的条件中进行采样和估计。由于Transformer的提出，对计算这些条件概率模型的表达能力有了显著提高。

学习执行单个任务可以在概率框架中表示为估计条件分布 $p(\text{output}|\text{input})$ 。由于一个通用系统应该能执行许多不同的任务，即使对于相同的输入，系统不仅依赖于输入，还要依赖要执行的任务。即系统应该建模 $p(\text{output}|\text{input,task})$ 。这在多任务和元学习的设定中已经被不同程度地形式化。

正如前人指出，语言模型提供了一种灵活的方式来指定任务、输入和输出。它们都可以表示为符号序列，例如，一个翻译训练样本可以写成序列(translate to french, english text, french text)。同理，阅读理解训练样本可以写成(answer the question, document, question, answer)。通过这种格式可以训练单个模型来推理和执行许多不同的任务。

互联网中包含大量的信息，可以无需交互式通信被动地获取。作者的推测是，具有足够容量的语言模型将开始学习推断和执行自然语言序列中展示的任务，以更好地预测它们，而不管它们的获取方式如何。如果语言模型能够做到这一点，实际上就是在执行无监督的多任务学习。作者通过分析语言模型在各种任务的零样本设置下的性能来测试这一点。

训练集

大多数先前的工作都是在单一文本领域中训练语言模型。作者的方法鼓励构建尽可能大和多样化的数据集。

一个可以获取多样和近乎无限文本数据的方法是爬虫，例如CommonCrawl，虽然这些数据比之前的语言建模数据集大很多个数量级，但它们存在严重的数据质量问题。

因此，作者创建了一个强调文本质量的爬虫，为了做到这一点，作者只爬取经过人工筛选/过滤的网页。从Reddit这个社交平台上爬取了所有至少获得3个karma的外部链接，karma这一指标可以被视为其他用户是否认为该链接有趣、存在教育意义、或仅有趣。

这样得到的数据集WebText包含了4500万个链接的文本子集，通过爬取这些链接并进行数据清理，获得了大于800万个文档，共约40G的文本。同时删除了作为其他数据集常见数据源的维基百科文档。

输入表示

一个通用的语言模型应该能够计算(并生成)任何字符串的概率。字节对编码(BPE, Byte Pair Encoding)是字符和词级语言建模之间一种折中的方法，它有效地在常见符号序列的词级输入和不常见符号序列的字符级输入之间进行插值。虽然它的名称中包含字节，但实现上通常操作的是Unicode代码点，而不是字节序列，这些实现需要包括完整的Unicode符号空间，基础词汇量将超过13万，这是一个过大的词汇量。而字节级的BPE(byte-level BPE)只需要大小为256的基础词汇。然而，直接将BPE应用于字节序列会导致子优化的合并，因为BPE使用基于频率的贪心启发式方法来构建标记词汇，BPE包含许多常见单词的多个版本，比如dog.、dog! 、dog?。为了避免这种情况，作者阻止BPE在任何字节序列上跨字符类别进行合并。对空格添加了一个例外，这显著提高了压缩效率，同时只对多个词汇标记之间的单词进行了最小的分割。

这种输入表示方法使我们能将词级LM的经验优势与字节级方法的通用性结合起来。由于该方法可以为任何Unicode字符串分配概率，使得我们可以在任何数据集上评估我们的LM，不受预处理、分词或词汇大小的限制。

模型

GPT-1和GPT-2对比

作者使用了基于Transformer的架构构建语言模型，该模型很大程度上遵循了GPT-1的细节，但做了一些修改。层归一化被移动到每个子块(sub-block)的输入处(Pre-LN)，并在最后一个自注意力块之后添加了一个额外的层归一化。并且使用了一种修改后的初始化方法，考虑了模型深度上残差路径的累积。在初始化时，将残差层的权重缩放因子设置为 $1/\sqrt{N}$ ，其中 $N$ 是残差层的数量。词汇表扩充到50274个词汇。将上下文大小从512扩大到1024，使用了更大的批量大小512。

实验

训练和基准测试了四个不同大小的语言模型，如上表所示。最小的模型等同于原始的GPT模型，第二小的等同于BERT的最大模型，最大的模型称为GPT-2，比GPT模型的参数量多了一个数量级。

语言建模

作为零样本任务迁移的初始步骤，作者对WebText 语言模型在其训练的主要任务——语言建模上的零样本领域迁移进行了评估。

WebText语言模型在不同领域和数据集之前的零样本迁移效果良好。在8个数据集的7个中改进了SOTA结果。在100万到200万个训练标记的小数据集(如Penn Treebanh和WikiText-2)上观察到了显著的改进。在用于测试长期依赖性的数据集(如LAMBADA和Children’s Book Test)上也观察到了显著的提升。

然而，在One Billion Word Benchmark数据集上仍然明显不如先前的工作。这可能是因为它既是最大的数据集，又具有一些最具破坏性的预处理方法——1BW的句子级乱序移除了所有的长距离结构。

Children’s Book Test

儿童读物测试(Children’s Book Test,CBT) 旨在检查语言模型在不同类别的单词上的表现：命名实体、名词、动词和介词。CBT不像其他评估指标一样报告困惑度，而是报告在自动构建的填空测试上的准确性，测试的任务是预测10个可能的选择中省略的单词的正确答案。

如图2所示，随着模型规模的增加，性能稳步提高，并且在这个测试中缩小了与人类表现之间的差距。GPT-2在普通名词上取得了93.3%的最新最佳结果，并在命名实体上取得了89.1%的最佳结果。

LAMBADA

LAMBADA数据集测试系统在文本中建模长距离依赖关系的能力。任务是预测句子的最后一个单词，这需要至少50个上下文标记才能让人类成功预测。GPT-2将最新研究的困惑度从99.8降低到8.6，并将语言模型在这个测试中的准确性从19%提高到52.66%。

Winograd Schema challenge

Winograd模式挑战旨在通过衡量系统解决文本中歧义的能力来衡量系统进行常识推理的能力。最近，有研究者使用语言模型在这个挑战上取得了显著进展，通过预测具有更高概率的歧义解决方案来解决问题。作者遵循他们的问题表述，并在图3中使用完整和部分评分技术来展示模型的性能。GPT-2将最新研究的准确性提高了7%，达到70.70%。

阅读理解

CoQA测试阅读理解能力，以及模型回答依赖于对话历史的问题(如为什么)的能力。

当GPT-2在给定文档、相关对话历史和最后一个标记 $A$ 的条件下使用贪心解码时，在开发集上达到了55 F1的性能。这与4个基准系统中的3个的性能相匹配或超过，而这些基准系统是在127000多个手动收集的问答对上进行训练的。

目前监督学习的最佳方法是基于BERT的系统，其F1性能接近于人类的89。虽然GPT-2的性能对于没有任何监督训练的系统来说令人兴奋，但对其答案和错误的一些检查表明，GPT-2经常使用简单的基于检索的启发式方法。

摘要

在CNN和Daily Mail数据集上测试了GPT-2进行摘要生成的能力。为了引导摘要生成行为，作者在文章后面添加了文本TL;DR:，并使用Top-k随机采样生成了100个标记，其中k = 2，以减少重复，并鼓励比贪心解码更抽象的摘要。

使用这100个标记中的前3个生成的句子作为摘要。在ROUGE 1,2,L指标上，生成的摘要只是开始接近经典神经网络基线的性能，并且刚好优于从文章中选择3个随机句子。当移除任务提示时，GPT-2的性能在综合指标上下降了6.4个点，这表明它可以通过自然语言来调用特定任务的行为能力。在摘要生成方面表现一般。

翻译

测试了GPT-2是否已经开始学习如何将一种语言翻译成另一种语言。为了帮助它推断出这是所期望的任务，做将语言模型的条件设置为一个样本对的上下文，格式为english sentence = french sentence，然后在最后一个提示的english sentence = ，使用贪心解码从模型中进行抽样，并将第一个生成的句子作为翻译结果。

在WMT-14英法测试集上，GPT-2获得了5个BLEU分数，略低于以前在无监督词汇翻译研究中推断出的逐词替换双语词典的方法。在WMT-14法英测试集上，GPT-2能够利用其非常强大的英语语言模型表现得更好，达到了11.5个BLEU分数。这超过了几个无监督机器翻译基线，但仍远远不及当前最好的无监督机器翻译方法的33.5个BLEU分数。

问答

测试语言模型中包含的信息的一种潜在方法是评估它在事实型问题中生成正确答案的概率。类似于翻译，语言模型的上下文样本以问答对的形式进行初始化，这有助于模型推断出数据集的短答案风格。当使用类似于SQUAD的阅读理解数据集上常用的完全匹配度量来评估时，GPT-2在问题回答上的准确率为4.1%。

GPT-2对其生成的答案赋予的概率是很好校准的，在它最有信心的1%的问题上准确率为63.1%。GPT-2在开发集问题上生成的30个最有信心的答案显示在表5中。与将信息检索与抽取式文档问题回答相混合的开放域问答系统的30%至50%的准确率范围相比，GPT-2的性能仍然要差得多。

讨论

许多工作致力于学习理解和对有监督和无监督预训练方法的表示进行批判性评估。研究结果表明，无监督任务学习是一个值得探索的有前途的研究领域。这些发现可能有助于解释预训练技术在下游自然语言处理任务中的广泛成功，因为作者展示了在极限情况下，其中一种预训练技术开始直接学习执行任务，而无需进行有监督的调整或修改。

在阅读理解任务中，GPT-2的性能在零样本设置下与有监督基线相媲美。然而，在其他任务(摘要)上，根据定量指标，其性能仍然很基础。尽管作为研究结果具有指导意义，但从实际应用的角度来看，GPT-2的零样本性能仍远未达到可用的水平。

作者研究了WebText语言模型在许多经典自然语言处理任务上的零样本性能，但还有许多其他任务可以进行评估。毫无疑问，仍有许多实际任务，GPT-2的性能仍然不如随机结果。即使在评估的常见任务中，如问答和翻译，只有当语言模型具有足够的容量时，它们才开始超过简单的基线。

虽然零样本性能为GPT-2在许多任务上的潜在性能建立了一个基准，但目前还不清楚微调的上限在哪里。在某些任务上，GPT-2的完全抽象输出与基于抽取式指针网络的输出有显著区别，后者目前在许多问答和阅读理解数据集上是最先进的。

结论

当一个大型语言模型在足够大且多样化的数据集上进行训练时，它能够在许多领域和数据集上表现出色。GPT-2在8个测试的语言建模数据集中，有7个达到了最先进的性能。模型在零样本设置下能够执行的任务的多样性表明，训练容量高的模型在最大化足够多样化文本语料库的似然性时，开始学习如何执行许多令人惊讶的任务，而无需监督。

总结

⭐ 作者提出了GPT-2，针对GPT-1进行了一些修改，基于无监督训练。使用Pre-LN的层归一化方法；在最后一个自注意力块后添加了一个额外的层归一化；修改了残差层权重缩放因子；扩充了词汇表；将上下文大小从512扩充到了1024；使用了更大的批次512。

作者开始注意到零样本设定下的表现，观察到语言模型的容量对性能至关重要。给最终性能超群的175B参数GPT-3一个启发。

Docker 和 Kubernetes 入门到精通：运维工程师的实战笔记 (近5万字) 运维小贺运维 linux docker 容器 kubernetes 云原生 kubelet
文章目录1.Docker1.1Docker是什么？1.1.1容器服务原理1.2Docker的三大概念1.2.1镜像1.2.2容器1.2.3仓库1.2.4总结1.3Docker常用命令1.3.1镜像常用命令1.3.2容器常用命令1.4Dockerfile1.4.1commit的局限1.4.2Dockerfile是什么？1.4.3如何使用Dockerfile制作镜像?1.4.4Dockerfile中常
Flutter-完整开发实战详解(一、Dart-语言和-Flutter-基础) 2401_85122662 flutter
《Android学习笔记总结+最新移动架构视频+大厂安卓面试真题+项目实战源码讲义》完整开源地址：https://docs.qq.com/doc/DSkNLaERkbnFoS0ZF基本类型var可以定义变量，如vartag=“666”，这和JS、Kotlin等语言类似，同时Dart属于动态类型语言，支持闭包。Dart中number类型分为int和double，其中java中的long对应的也是Da
《移动App测试实战》读书笔记 xh15 2017笔试面试修炼软件测试移动测试读书笔记
最近看完了《移动App测试实战》，这里做一点笔记，后面可以重温。功能测试自动化轻量接口自动化测试（JMeter）：JMeter是一款开源测试工具，多用于接口测试用例的分层：CGI：通用网关接口，常称为单个业务接口Function：请求组合，包含多个CGI层接口的调用TestCase：单个测试用例TestSuite：多个测试用例的集合UI层的自动化面向Android：AndroidSDK提供的UIA
学习笔记：oracle online系列：oracle：Per-Process PGA memory limit 认真就输DBA Oracle 学习随笔学习笔记 oracle
我们的文章会在微信公众号IT民工的龙马人生和博客网站(www.htz.pw)同步更新，欢迎关注收藏，也欢迎大家转载，但是请在文章开始地方标注文章出处，谢谢！由于博客中有大量代码，通过页面浏览效果更佳。本文转自朋友的真实案例分享。oracleonline系列：oracle：Per-ProcessPGAmemorylimit前几日，东区某客户的19crac出现了ORA-04030，从报错的trace来
【OD机试题解法笔记】连续出牌数量 xuwzen 编码训练笔记深度优先算法
题目描述有这么一款单人卡牌游戏，牌面由颜色和数字组成，颜色为红、黄、蓝、绿中的一种，数字为0-9中的一个。游戏开始时玩家从手牌中选取一张卡牌打出，接下来如果玩家手中有和他上一次打出的手牌颜色或者数字相同的手牌，他可以继续将该手牌打出，直至手牌打光或者没有符合条件可以继续打出的手牌。现给定一副手牌，请找到最优的出牌策略，使打出的手牌最多。输入描述输入为两行，第一行是每张手牌的数字，数字由空格分隔，第
Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
Docker技术笔记-从零开始的容器技术之旅青竹易寒 docker 学习容器
理论一、容器技术简介容器是一种轻量级、可移植、隔离的软件环境，通过操作系统级虚拟化实现资源隔离,确保应用程序在不同环境中能够保持一致运行。容器和虚拟机对比对比维度容器(Docker)虚拟机(VM、KVM)架构原理共享宿主机内核,通过命名空间(Namespaces)和控制组(Cgroups)实现资源隔离。通过Hypervisor虚拟化硬件资源,每个VM运行独立完整的操作系统(GuestOS)。资源消
C 语言:20250708笔记遇见尚硅谷 c语言笔记开发语言
内容提要C语言概述数据类型常量变量C语言概述计算机基础计算机的组成计算机组成计算机：能进行计算以及逻辑处理的设备硬件：组成计算机的物理部件。（内存条、CPU、硬盘..）开发中对于硬件的认知：硬件包括电子设备、单片机、集成电路和嵌入式系统。软件：计算机中运行的程序和数据。开发中对于软件的认知：软件分为系统软件（OS）、应用软件和编程工具（编译器）计算机的六大部件中央处理器（CPU）：控制+计算内存：
12.Java SDK源码分析系列笔记-PriorityQueue Thinker QAQ Java SDK源码分析 java 笔记 python
文章目录1.PriorityQueue是什么2.使用3.源码分析3.1.属性3.2.有参构造3.2.1.初始化元素到数组中3.2.2.维护堆的属性3.2.2.1.下沉操作3.3.插入3.3.1.上浮操作3.4.删除3.4.1.下沉操作4.参考1.PriorityQueue是什么是一个队列，只不过加上了优先级的概念，换句话说队列里的元素是根据某种规则排好序的2.使用publicclassPriori
DPDK探测设备并初始化分享放大价值 DPDK dpdk probe 设备初始化 mmap
本文整理下之前的学习笔记，基于DPDK17.11版本源码分析。主要看一下DPDK探测网卡设备，并进行初始化的流程，用到了类似kernel中的总线-设备-驱动模型。本文的重点之一是DPDK如何在用户态操作网卡寄存器，这里先给个答案:想要操作网卡寄存器，需要用到网卡的基地址BAR，intel网卡一般使用BAR0就行，通过mmap此文件/sys/bus/pci/devices/'pciaddress'/
Python学习打卡：day09 胜天半子祁厅 Python python 学习开发语言
day9笔记来源于：黑马程序员python教程，8天python从入门到精通，学python看这套就够了目录day964、字典课后习题65、5类数据容器的总结对比数据容器分类数据容器特点对比66、数据容器的通用操作遍历统计len、max和min转换list(容器)、tuple(容器)、str(容器)、set(容器)排序容器通用功能总览67、拓展——字符串的大小比较ASCII码表字符串比较68、函数
Python学习打卡：day02
day2笔记来源于：黑马程序员python教程，8天python从入门到精通，学python看这套就够了目录day28、字符串的三种定义方式字符串在Python中有多种定义形式字符串的引号嵌套9、字符串的拼接10、字符串格式化11、格式化的精度控制12、字符串格式化的方式213、对表达式进行格式化14、字符串格式化的课后练习题15、数据输入（input语句）input语句（函数）input语句获取
【文献精读笔记】Explainability for Large Language Models: A Survey （大语言模型的可解释性综述）（五）百万年薪天才少女人工智能人工智能机器学习深度学习
****非斜体正文为原文献内容（也包含笔者的补充），灰色块中是对文章细节的进一步详细解释！五、解释评估（ExplanationEvaluation）在前面的章节中，我们介绍了不同的解释技术和它们的用途，但评估它们如何忠实地反映模型的推理过程仍然是一个挑战。我们将评估大致分为两类：传统微调范式的局部解释评估（第5.1节）和提示范式中自然语言CoT解释的评估（第5.2节）。评估的两个关键维度是对人类的
CS:APP读书笔记--信息的表示和处理你都会上树？ CS:APP 笔记程序人生
信息的存储和表示字节端序在内存中按照从最低到最高有效字节的顺序存储对象，这种最低有效字节在最前面的方式，称为小端法。在内存中按照从最高到最低有效字节的顺序存储对象，这种最高有效字节在最前面的方式，称为大端法。例如：对于int32类型变量，其存储地址位于0x100，其十六进制值为0x12345678，其地址范围为ox100~0x103：//大端法地址：0x1000x1010x1020x1031234
Gin 框架中的优雅退出 Code季风 Gin入门指南 gin golang 开发语言 go 后端
在构建可靠的Web应用程序或微服务时，确保应用程序能够“优雅退出”是至关重要的。本文将基于你的笔记，深入探讨Gin框架中如何实现优雅退出，并解释其定义、重要性以及具体的实现方法。一、优雅退出的定义和重要性1.1什么是“优雅退出”？所谓优雅退出（GracefulShutdown）是指：在程序接收到关闭信号时（比如用户按下Ctrl+C或者系统发送SIGTERM），不要立即终止进程，而是：停止接收新的请
动手学深度学习13.7. 单发多框检测（SSD）-笔记&练习（PyTorch） scdifsn 深度学习笔记 pytorch ssd 单发多框检测（SSD）目标检测 mAP评价
以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：45SSD实现【动手学深度学习v2】_哔哩哔哩_bilibili本节教材地址：13.7.单发多框检测（SSD）—动手学深度学习2.0.0documentation本节开源代码：…>d2l-zh>pytorch>chapter_optimization>ssd.ipynb单发多框
动手学深度学习3.3线性回归的简洁实现-笔记&练习（PyTorch） scdifsn 深度学习线性回归笔记 pytorch
以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：线性回归的简洁实现_哔哩哔哩_bilibili本节教材地址：3.3.线性回归的简洁实现—动手学深度学习2.0.0documentation(d2l.ai)本节开源代码：...>d2l-zh>pytorch>chapter_linear-networks>linear-regre
Python学习笔记2-垃圾回收机制 Carrie_Lei Python python 学习笔记
Python的垃圾回收机制是自动管理内存的系统，用于回收不再使用的内存，以避免内存泄漏和优化内存使用。Python使用引用计数（ReferenceCounting）和垃圾回收（GarbageCollection）两种方式来管理内存。1.引用计数(ReferenceCounting)引用计数是Python内存管理的基础机制。每个对象都维护一个引用计数器，记录有多少个引用指向该对象。当一个新的引用指向
Python数据分析学习笔记：字符串统计 NIKEeri python pandas 字符串匹配 python 数据分析学习
一、题目来源KagglePandas-Exercise:SummaryFunctionsandMaps章节二、题目要求描述一瓶葡萄酒时，可用的词汇有限。哪种词出现频率更高：“tropical”还是“fruity”？统计description列中这两个词的出现次数。忽略大小写。三、我的思路（使用str.contains统计总次数）tropical_count=reviews['description
【机器学习|学习笔记】随机森林（Random Forest, RF）详解，附代码。努力毕业的小土博^_^ 机器学习基础算法优质笔记1 机器学习学习笔记随机森林人工智能
【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。文章目录【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。前言起源随机子空间法与Bagging的萌芽原理算法机制理论保障发展应用优缺点优点缺点Python实现示例（Scikit-learn）欢迎铁子们点赞、关注、收藏
Linux 命令使用笔记【sysctl】 fzip Linux linux 服务器运维
名称在系统运行时，配置修改内核参数概要sysctl[options][variable[=value]][...]sysctl-p[fileorregexp][...]描述sysctl用于在linux系统运行时修改内核参数。可以修改的参数都在/proc/sys/文件夹下。Linux中的sysctl支持需要Procfs。您可以使用sysctl来读写sysctl数据。参数variable要从中读取的键
Linux 命令使用笔记【zcat】 fzip Linux linux zcat
zcat命令zcat命令用于不真正解压缩文件，就能显示压缩包中文件的内容的场合。语法zcat(选项)(参数)选项-S：指定gzip格式的压缩包的后缀。当后缀不是标准压缩包后缀时使用此选项；-c：将文件内容写到标注输出；-d：执行解压缩操作；-l：显示压缩包中文件的列表；-L：显示软件许可信息；-q：禁用警告信息；-r：在目录上执行递归操作；-t：测试压缩文件的完整性；-V：显示指令的版本信息；-l
PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第1-11个视频笔记）胡说八道的Dr. Zhu 深度学习 pytorch 学习
本学习笔记源自于B站up主【我是土堆】的视频教程：PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】本博客是该视频教程中第1-11个视频的详细学习笔记，第12-22个视频、第23-33个视频的详细学习笔记链接如下：PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第12-22个视频笔记）PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第23-33个视频笔记）目录1、P
关于 Linux中系统调优的一些笔记山河已无恙 Linux笔记 Linux 性能调优 1024程序员节 linux 运维
写在前面推送的的邮件里看到有大佬讲的公共课，听了之后这里整理学习笔记。因为是公开课，所以讲的很浅，没接触过，这里做为了解，长长见识。博文内容包括系统调优原理概述如何检测系统的性能瓶颈如何进行内核参数调优如何限制服务的资源占用自定义tuned调优配置集我突然又明白，死亡是聪明的兄长，我们可以放心地把自己托付给他，他会知道在我们有所准备的适当时刻前来。我也突然懂得，原来痛苦、失望和悲愁不是为了惹恼我们
PyTorch笔记3----------统计学相关函数 HuashuiMu花水木 PyTorch笔记 pytorch 笔记人工智能
1.基础函数importtorcha=torch.rand(2,2)print("a:\n",a)print('########################')print("平均值:\n",torch.mean(a,dim=0))print("总和:\n",torch.sum(a,dim=0))print("所有元素的积:\n",torch.prod(a,dim=0))print("最大值:\
CSC研修计划的书写
博主最近在申请CSC，所以也会更新一下自己的学习笔记，有需要的可以关注我一下，同时有问题大家可以一起交流一下啊一要求（fromCSC官网）①拟留学专业(研究课题)在国内外研究情况及水平；②拟选择的留学国别、留学单位及选择原因(应简单评述对方国家及留学单位在申请人所从事学科、专业领域的水平、优势，申请人及所在单位与对方有无合作基础及业务联系);③达到本次出国学习预期目标的可行性,结合本人目前从事的工
【机器学习笔记 Ⅱ】9 模型评估巴伦是只猫机器学习机器学习笔记人工智能
评估机器学习模型是确保其在实际应用中有效性和可靠性的关键步骤。以下是系统化的评估方法，涵盖分类、回归、聚类等任务的评估指标和技术：一、分类模型评估1.基础指标2.高级指标ROC-AUC：通过绘制真正例率（TPR）vs假正例率（FPR）曲线下面积评估模型整体性能。AUC=1：完美分类；AUC=0.5：随机猜测。适用于二分类及多分类（OvR或OvO策略）。混淆矩阵：可视化模型在各类别上的具体错误（如将
【机器学习笔记 Ⅱ】7 多类分类巴伦是只猫机器学习机器学习笔记分类
1.多类分类（Multi-classClassification）定义多类分类是指目标变量（标签）有超过两个类别的分类任务。例如：手写数字识别：10个类别（0~9）。图像分类：区分猫、狗、鸟等。新闻主题分类：政治、经济、体育等。特点互斥性：每个样本仅属于一个类别（区别于多标签分类）。输出要求：模型需输出每个类别的概率分布，且概率之和为1。实现方式One-vs-Rest(OvR)：训练K个二分类器（
【DeepSeek开源周】Day 4：DualPipe & EPLB 学习笔记蓝海星梦 DeepSeek开源周探秘开源学习笔记人工智能云计算分布式
目录一、DualPipe&EPLB概述二、DualPipe详解1.流水线并行策略（1）F-then-B策略（2）1F1B策略2.朴素流水线并行3.GPipe微批次流水线并行4.PipeStream5.ZBPP6.DualPipe7.DualPipeV8.流水线并行方案对比三、EPLB详解1.专家并行（EP）2.EPLB冗余专家策略3.负载均衡策略（1）分层负载均衡（2）全局负载均衡（3）接口和示例
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl