SZ laoluo

8个优秀的预训练模型，帮助您开始使用自然语言处理（NLP）

为什么要使用预训练模型？

本文涵盖的预训练NLP模型

多用途NLP模型

ULMFiT

有关ULMFiT的更多信息，请参阅：

Transformer

学习和阅读更多有关Transformer的资源：

谷歌的BERT

学习和阅读更多有关BERT的资源：

谷歌的Transformer-XL

有关学习和阅读有关Transformer-XL的更多信息的资源：

OpenAI的GPT-2

有关学习和阅读有关GPT-2的更多信息的资源：

Word嵌入

ELMO

学习和阅读有关ELMo的更多信息的资源：

Flair

学习和阅读更多有关Flair的资源：

其他预训练模型

StanfordNLP

学习和阅读更多有关StanfordNLP的资源：

如今，自然语言处理（NLP）应用程序已经无处不在。我似乎经常偶然发现网络和应用程序正在以某种形式利用NLP。简而言之，这是参与NLP领域的美好时光。

NLP采用率的快速增长主要得益于通过预训练模型实现转移学习的概念。在NLP的上下文中，转移学习本质上是在一个数据集上训练模型然后调整该模型以在不同数据集上执行不同NLP函数的能力。

这一突破使每个人都非常容易和简单，特别是那些没有时间或资源从头开始构建NLP模型的人。对于想要学习或过渡到NLP的初学者来说，它是完美的。

为什么要使用预训练模型？

作者已经努力为您设计基准模型！我们可以在我们自己的NLP数据集上使用该预训练模型，而不是从头开始构建模型来解决类似的NLP问题
需要进行一些微调，但它为我们节省了大量的时间和计算资源

在本文中，我展示了可用于开始NLP之旅的顶级预训模型，并复制了该领域的最新研究成果。您可以在这里查看我在计算机视觉中的顶级预训练模型上的文章。

如果你是NLP的初学者，我建议学习我们的热门课程 - ' 使用Python的NLP '。

本文涵盖的预训练NLP模型

我根据应用将预训练模型分为三类：

多用途NLP模型
ULMFiT
Transformer
谷歌的BERT
变压器-XL
OpenAI的GPT-2
Word嵌入
ELMO
Flair
其他预训练模型
StanfordNLP

多用途NLP模型

多用途模型是NLP世界的话题。这些模型为我们感兴趣的NLP应用程序提供动力 - 机器翻译，问答系统，聊天机器人，情感分析等。这些多用途NLP模型的核心组件是语言建模的概念。

简单来说，语言模型的目的是预测序列中的下一个单词或字符。我们在这里看每个模型时都会理解这一点。

如果您是NLP爱好者，那么您会喜欢这一部分。现在，让我们深入研究5个最先进的多用途NLP模型框架。我提供了每种模型的研究论文和预训练模型的链接。继续探索吧！

ULMFiT

ULMFiT由fast.ai的Jeremy Howard DeepMind的Sebastian Ruder提出并设计。你可以说ULMFiT是去年启动转学习会的版本。

正如我们在本文中所述，ULMFiT使用新颖的NLP技术实现了最先进的结果。该方法涉及将在Wikitext 103数据集上训练的预训练语言模型微调到新数据集，使其不会忘记它之前学到的内容。

ULMFiT优于众多最先进的文本分类任务。我对ULMFiT的喜爱之处在于它需要很少的例子来产生这些令人印象深刻的结果。让您和我这样的人更容易理解并在我们的机器上实现它！

如果您想知道，ULMFiT代表通用语言模型微调。“通用”这个词在这里非常贴切 - 该框架几乎可以应用于任何NLP任务。

有关ULMFiT的更多信息，请参阅：

使用ULMFiT和Python中的fastai库的文本分类（NLP）教程
ULMFiT的预训练模型
研究论文

Transformer

Transformer架构是NLP近期所有重大发展的核心。它于2017年由谷歌推出。当时，循环神经网络（RNN）被用于语言任务，如机器翻译和问答系统。

这种Transformer架构的性能优于RNN和CNN（卷积神经网络）。训练模型所需的计算资源也减少了。NLP中的每个人都是双赢的。看看下面的比较：

根据Google的说法，Transformer“应用了一种自我关注机制，可直接模拟句子中所有单词之间的关系，无论其各自的位置如何”。它使用固定大小的上下文（也就是前面的单词）来实现。太复杂了？我们举一个例子来简化这个。

“她在河岸找到了贝壳。”该模型需要明白，这里的“银行”是指岸，而不是金融机构。Transformer只需一步就能理解这一点。我鼓励您阅读下面链接的完整论文，以了解其工作原理。它会让你大吃一惊。

下面的动画很好地说明了Transformer如何处理机器翻译任务：

谷歌去年发布了一款名为Universal Transformer的改进版Transformer。还有一个更新，更直观的版本，名为Transformer-XL，我们将在下面介绍。

学习和阅读更多有关Transformer的资源：

谷歌的官方博客文章
Transformer的预训练模型
研究论文

谷歌的BERT

自谷歌公布其结果以来，BERT框架一直在掀起波澜，然后开放源代码背后的代码。我们可以辩论这是否标志着“ NLP的新时代 ”，但毫无疑问BERT是一个非常有用的框架，可以很好地推广到各种NLP任务。

BERT，简称乙 idirectional é ncoder ř对产权，认为从一个字的两侧（左侧和右侧）的上下文。以前的所有努力都是一次一个词的一面 - 左边或右边。这种双向性有助于模型更好地理解使用单词的上下文。此外，BERT旨在进行多任务学习，也就是说，它可以同时执行不同的NLP任务。

BERT是第一个用于预训练NLP模型的无监督，深度双向系统。它仅使用纯文本语料库进行训练。

在它发布时，BERT正在11个自然语言处理（NLP）任务中产生最先进的结果。相当不朽的壮举！您可以在短短几个小时内（在单个GPU上）使用BERT训练您自己的NLP模型（例如问答系统）。

学习和阅读更多有关BERT的资源：

谷歌的官方博客文章
BERT的预训练模型
研究论文

谷歌的Transformer-XL

对于NLP而言，谷歌的这一版本可能是一个非常重要的版本。如果你是一个初学者，这个概念可能会变得有点棘手，所以我鼓励你多读几遍来掌握它。我还在本节下面提供了多种资源，以帮助您开始使用Transformer-XL。

想象一下 - 你正在书的中途，突然出现了一本书或者一句话，这本书开头就提到过了。现在，你或我可以回想起它是什么。但可以理解的是，一台机器难以模拟长期依赖。

正如我们上面所看到的，实现此目的的一种方法是使用变形金刚。但它们是使用固定长度的上下文实现的。换句话说，如果使用这种方法，就没有太大的灵活性。

Transformer-XL很好地弥合了这个差距。它由Google AI团队开发，是一种新颖的NLP架构，可帮助机器理解超出固定长度限制的上下文。Transformer-XL比典型的Transformer快1800倍。

您可以通过Google发布的以下2个GIF了解这种差异：

Vanilla Transformer

Transformer-XL

如您现在所预测的，Transformer-XL在各种语言建模基准/数据集上实现了最新的最新结果。这是从他们的页面中取出的一张小桌子，说明了这一点：

方法enwiki8 text8十亿字WT-103 PTB（不带微调）上一个最佳1.06 1.13 23.7 20.5 55.5 Transformer-XL 0.99 1.08 21.8 18.3 54.5

上面链接并在下面提到的Transformer-XL GitHub存储库包含PyTorch和TensorFlow中的代码。

有关学习和阅读有关Transformer-XL的更多信息的资源：

谷歌的官方博客文章
Transformer-XL的预训练模型
研究论文

OpenAI的GPT-2

现在，这是一个非常有争议的条目。一些人可能会争辩说，GPT-2的发布是OpenAI的营销噱头。我当然知道他们来自哪里。但是，我认为至少还要尝试OpenAI发布的代码是很重要的。

首先，为那些不知道我在说什么的人提供一些背景信息。OpenAI在2月写了一篇博客文章（下面的链接），他们声称已经设计了一个名为GPT-2的NLP模型，它非常好，以至于他们无法承担因恶意使用而发布完整版本的费用。这当然得到了社区的关注。

GPT-2经过培训，可以预测40GB互联网文本数据中的下一个词。该框架也是基于变压器的模型，该模型在800万个网页的数据集上训练。他们在他们的网站上发布的结果简直令人震惊。该模型能够根据我们输入的几个句子编写一个完全清晰的故事。看看这个例子：

难以置信，对吧？

开发人员已经发布了一个小得多的GPT-2版本供研究人员和工程师测试。原始模型有15亿个参数 - 开源样本模型有1.17亿个。

有关学习和阅读有关GPT-2的更多信息的资源：

OpenAI的官方博客文章
GPT-2的预训练模型
研究论文

Word嵌入

我们使用的大多数机器学习和深度学习算法都无法直接使用字符串和纯文本。这些技术要求我们在执行任何任务（例如回归或分类）之前将文本数据转换为数字。

因此，简单来说，单词嵌入是将文本块转换为用于执行NLP任务的数字。单词嵌入格式通常尝试使用字典将单词映射到向量。

您可以在下面的文章中对单词嵌入，不同类型以及如何在数据集中使用它们进行更深入的解释。如果您不熟悉这个概念，我认为本指南必读：

在本节中，我们将介绍NLP的两个最先进的字嵌入。我还提供了教程链接，以便您可以对每个主题有实际的了解。

ELMO

不，这个ELMo不是芝麻街的（无可否认的）角色。但是这个ELMo是语言模型嵌入的缩写，在构建NLP模型的环境中非常有用。

ELMo是一种在向量和嵌入中表示单词的新方法。这些ELMo字嵌入有助于我们在多个NLP任务上获得最先进的结果，如下所示：

让我们花点时间了解ELMo的工作原理。回想一下我们之前讨论过的双向语言模型。从这篇文章中得到启示，“ELMo单词向量是在双层双向语言模型（biLM）之上计算的。这个biLM模型有两层堆叠在一起。每层有2次传球 - 前传和后传：

ELMo单词表示考虑用于计算单词嵌入的完整输入句子。因此，术语“读取”在不同的上下文中将具有不同的ELMo向量。当相同的向量被分配给单词“read”而不管使用它的上下文时，与旧的单词嵌入相去甚远。

学习和阅读有关ELMo的更多信息的资源：

学习ELMo从文本中提取特征的分步NLP指南
用于预训练模型的GitHub存储库
研究论文

Flair

Flair不是一个单词嵌入，而是单词嵌入的组合。我们可以将Flair 称为结合了GloVe，BERT，ELMo等嵌入的NLP库.Zalando Research的优秀人员开发了开源Flair。

该团队已经为以下NLP任务发布了几个预训练模型：

名称 - 实体识别（NER）
词性标注（PoS）
文本分类
培训定制模型

不相信吗？那么，这个比较表将带你到那里：

'Flair Embedding'是Flair库中包含的签名嵌入。它由上下文字符串嵌入提供支持。您应该阅读本文以了解为Flair提供动力的核心组件。

我特别喜欢Flair的是它支持多种语言。如此多的NLP版本都在执行英语任务。如果NLP要在全球范围内获得牵引力，我们需要扩展到这一点！

学习和阅读更多有关Flair的资源：

NLP的Flair简介：一个简单但功能强大的最先进的NLP库
Flair的预训练模型

其他预训练模型

StanfordNLP

说到扩展NLP超越英语，这里有一个已经设置基准的库。作者声称StanfordNLP支持超过53种语言 - 这当然引起了我们的注意！

我们的团队是第一批使用该库并在真实数据集上发布结果的团队。我们玩弄了它，发现StanfordNLP真正开辟了很多在非英语语言中应用NLP技术的可能性。像印地语，中文和日语。

StanfordNLP是一系列经过预先训练的最先进的NLP模型。这些模型不仅仅经过实验室测试 - 作者在2017年和2018年的CoNLL比赛中使用了这些模型。在StanfordNLP中打包的所有预训练NLP模型都是基于PyTorch构建的，可以在您自己的注释数据上进行训练和评估。

我们认为您应该考虑StanfordNLP的两个主要原因是：

用于执行文本分析的完整神经网络管道，包括：
符号化
多字令牌（MWT）扩展
词形还原
词性（POS）和形态特征标记
依赖性解析
一个稳定的官方维护的CoreNLP Python接口

学习和阅读更多有关StanfordNLP的资源：

StanfordNLP的预训练模型

芯片人生存之道：如何偷偷扩展视野，但不被看作“抢活“的人？ iccnewer microsoft
最近和几个芯片设计同行聊天，发现大家有个共同的困扰："想多了解一些其他模块的知识，但一伸手就被误解成抢别人的活...""一问问题多了，就给人一种'想接手'的错觉。""我就想学点新东西，怎么这么难？"确实，这是芯片行业的一个微妙问题。一方面，技术日新月异，谁都想拓展自己的技能；另一方面，每个人都守着自己那一亩三分地，生怕别人"越界"。那么，如何既能扩展自己的视野，又不会被同事视为"威胁"呢？一、理解
Python项目自动化模板构建：深入理解Cookiecutter TEDDYYW
本文还有配套的精品资源，点击获取简介：Python项目的标准化构建过程对于代码的整洁和可维护性至关重要。本文将深入探讨如何利用"cookiecutter"这一Python命令行工具自动化项目的初始化过程。Cookiecutter通过读取预定义模板并根据用户输入自动生成项目结构，简化了项目设置。我们将详细了解"cookiecutter-python-master"模板的组成，包括标准项目结构、初始化
如何使用JSON输出解析器解析语言模型的输出 vaidfl json 语言模型 easyui python
在现代AI应用中，让语言模型返回结构化的数据是一个重要的能力，特别是在需要进一步处理或集成的时候。本文将深入探讨如何利用JsonOutputParser来解析语言模型的JSON输出。技术背景介绍随着语言模型的普及，许多应用场景需要从自然语言处理任务中获取结构化的输出。针对这一需求，输出解析器应运而生，它能够帮助我们定义JSON模式，通过提示语言模型生成符合该模式的输出，并将其解析为JSON格式。核
使用LangChain加载College Confidential数据 scaFHIO langchain python
#使用LangChain加载CollegeConfidential数据##技术背景介绍CollegeConfidential是一个提供有关3800+所大学和学院信息的平台。它被广泛使用于教育咨询和申请指导领域。为了方便开发者从CollegeConfidential获取数据，我们可以使用LangChain的`CollegeConfidentialLoader`模块进行加载和处理。##核心原理解析La
docker学习整理 24k小善 java 大数据云计算
一、Docker核心原理：像租房装修一样理解容器1.1容器vs虚拟机：合租vs买别墅虚拟机就像买别墅：每个别墅（虚拟机）自带独立地基（操作系统）、水电系统（系统资源），启动慢（分钟级）、资源占用大（GB级）[1][10]容器就像合租：大家共享小区基础设施（宿主机内核），但每个房间（容器）有自己的家具摆放（应用和依赖）。轻量（MB级）、秒级启动，还能随时搬走（迁移）[9]1.2镜像分层：乐高积木式打
使用LocalAI进行文本嵌入的实战指南 bavDHAUO python
技术背景介绍文本嵌入是一种将文本片段转换为高维向量的技术，可以用于自然语言处理任务中的相似性计算、信息检索等应用。LocalAI提供了一种本地化的嵌入解决方案，允许开发者在本地环境中运行和测试嵌入模型。通过在本地部署LocalAI服务，您可以避免依赖外部API，享受更快的响应速度和更好的数据隐私。核心原理解析LocalAIEmbedding类主要负责与本地运行的LocalAI服务通信，进行文本嵌入
嵌入式系统中的状态机模式 boringhex.top MCU 嵌入式设计模式
在嵌入式系统中，状态机模式是一种常用的设计模式，通过定义系统的不同状态及其转换规则，帮助开发者更好地管理系统的行为和状态变化。本文将详细讲解状态机模式，并结合实例深入分析，帮助读者深入理解这一模式在嵌入式系统中的应用。状态机模式概述状态机模式（StateMachinePattern）是一种行为型设计模式，它允许对象在其内部状态改变时改变其行为。状态机模式通过将状态封装为独立的类，使得对象在不同状态
使用 Argilla 进行大语言模型数据管理与监控 qahaj 语言模型 python 人工智能
技术背景介绍Argilla是一个开源的数据管理平台，专为大语言模型（LLMs）设计。它旨在通过快速的数据管理以及结合人类和机器的反馈，帮助开发者构建更强大的语言模型。同时，Argilla支持整个MLOps周期的每个步骤，从数据标注到模型监控。核心原理解析Argilla的核心优势在于其灵活的数据管理流程和强大的反馈机制。通过Argilla，开发者可以实时监控模型性能，并根据需要调整数据标注策略。这种
线性代数介绍 ZhuBin365 其它机器学习线性代数人工智能
线性代数介绍线性代数是数学的一个重要分支，它研究向量空间、线性变换和线性方程组。其概念抽象，应用广泛，是现代科学技术中不可或缺的数学工具。本篇将详细解释线性代数中的核心概念，包括行列式、矩阵、向量与向量空间、线性方程组、特征值与特征向量以及二次型，力求深入浅出，帮助读者全面理解。一、行列式(Determinants)行列式是线性代数中一个fundamental的概念，它是一个将方阵映射到一个标量的
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
java将动态图转换成静态图_如何用最简单的方法把静态图变成动图？ PEI Lobster java将动态图转换成静态图
在今日头条浏览文章时，我们经常会看到有些作者在文章中插入了一些动态图片，不但美化了页面，而且起到了简明扼要的说明作用，让读者对文章内容加深了理解，也提高了文章的阅读量和点击量。这样的动态效果是如何制作的呢？主要有两个步骤：首先要制作出图片动态效果的视频，一般是MP4格式，第二步用格式工厂等文件格式转换软件，把MP4转换为gif动画格式，然后就可以把它插入到网页中。这其中的难点和重点就在于制作图片的
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
Multisim在射频电路仿真与实验教学中的应用探究 She Ran 546 课程设计
摘要本文深入探究Multisim在射频电路仿真与实验教学中的应用。阐述Multisim软件在射频领域的功能特点，通过具体射频电路实验案例，详细说明如何运用Multisim进行电路搭建、参数设置与仿真分析。探讨其在实验教学中对学生理解射频电路原理、提升实践能力的积极作用，以及在丰富教学手段、提高教学质量方面的显著优势，为射频电路实验教学改革提供新思路与方法。关键词Multisim；射频电路；仿真；实
C语言【文件操作】详解下 Run_Teenage C语言基础 c语言
引言详细介绍了文件的随机读写函数和文件读取结束的判定看这篇博文前，希望您先仔细看一下这篇博文，理解一下文件指针和流的概念：C语言【文件操作】详解上-CSDN博客一、文件的随机读写函数1.fseek函数根据文件指针的位置和偏移量来定位文件指针（文件内容的光标）。函数原型：intfseek(FILE*stream,longintoffset,intorigin);作用：重新定位流位置指示器参数：str
HarmonyOS5开发：手把手教你用 Ark-TS UI 做一个会 “动” 的计数器：从代码到原理全解析 harmonyos-next
今天咱们用鸿蒙5的Ark-TSUI做一个简单又有趣的计数器应用。点击按钮数字就会增加，而且界面还能自动更新。通过这个案例，你能轻松理解Ark-TSUI的核心玩法。一、最终效果长什么样？打开应用，你会看到一个大按钮，上面写着“点击加1”。每次点击按钮，按钮上方的数字就会变大。比如第一次点击变成“1”，第二次变成“2”，依此类推。整个过程不需要手动刷新页面，数字会自动变化。二、完整代码长这样types
NLP高频面试题（七）——GPT和Bert的mask有什么区别？ Chaos_Wang_ NLP常见面试题自然语言处理 gpt bert
GPT和BERT的Mask机制对比：核心区别与优化策略在NLP领域，GPT和BERT是最具代表性的预训练语言模型之一。它们都在训练过程中使用了Mask机制来引导模型学习语言表示，但具体实现方式和目标却有所不同。本文将深入探讨GPT和BERT的Mask方法的核心区别，并分析其优化策略。1.BERT的Mask机制：基于MLM（MaskedLanguageModel）BERT（Bidirectional
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
平衡二叉树（AVL树）：数据结构特性与自平衡技术详解 One Key Variable 课程设计
摘要平衡二叉树，尤其是AVL树，在追求高效数据存储与检索的场景中占据重要地位。本文深入剖析AVL树的数据结构特性，详细解读其自平衡技术原理与实现，帮助读者理解AVL树如何在动态数据操作中维持高效性能。一、引言在数据处理过程中，二叉搜索树虽能实现快速查找，但在频繁插入和删除节点时，可能因结构失衡导致查找效率大幅下降。AVL树作为一种自平衡二叉搜索树，通过严格的平衡条件和自平衡技术，确保树在动态操作下
我的编程学习之旅 Stars·ꦿ໊ོ 学习
大家好，我是一名编程领域的初学者，怀揣着对代码世界的无限热忱，踏上了这充满挑战与惊喜的学习之路。我并非本科出身，在过往的学习，逐渐被编程的魅力所吸引。日常里，我喜欢拆解电子产品、探究其原理，这份好奇心也驱使我深入代码的海洋，期望能从软件层面创造更多“奇迹”。如今，我选择从C语言开始敲开编程世界的大门，它作为一门基础且强大的编程语言，有着广泛的应用场景，无论是底层系统开发、嵌入式编程，还是对理解计算
Vue2与Vue3组件开发全维度对比实战指南 Forever丿顾北专题文章 vue.js 前端前端框架
Vue2与Vue3组件开发全维度对比实战指南一、组件基础架构对比1.1组件定义方式演进Vue2OptionsAPI详解在Vue2中，组件主要通过OptionsAPI来定义。OptionsAPI将组件的不同方面，如数据、方法、生命周期钩子等，分开定义在一个对象中。这种方式对于初学者来说，易于理解和上手。以一个简单的计数器组件为例：{{count}}增加exportdefault{data(){ret
微软 LIDA 库：基于大模型的自动化数据分析与可视化窝窝和牛牛 microsoft 数据分析
微软LIDA库：基于大模型的自动化数据分析与可视化一、核心架构与LLM交互流程调用LLM生成数据摘要基于LLM推理分析目标LLM生成可视化代码结合图像生成模型优化原始数据Summarizer模块结构化摘要GoalExplorer模块可视化目标列表VizGenerator模块可执行图表代码Infographer模块风格化信息图表二、LLM交互核心功能1.多模型支持架构兼容主流LLM服务商：通过统一接
堆数据结构：从基础原理到高效算法实现的技术探讨 Everyrt 课程设计
摘要堆作为一种特殊的树形数据结构，在多种算法场景中发挥着核心作用。本文深入剖析堆的基础原理，详细阐述堆的构建、插入、删除等操作的实现细节，并探讨其在优先队列、堆排序等高效算法中的应用，助力读者全面掌握堆数据结构及其应用技术。一、引言堆数据结构以其独特的特性，能够高效地获取集合中的最大（或最小）元素。无论是操作系统中的进程调度，还是搜索算法中的最优解筛选，堆都扮演着不可或缺的角色。理解堆的原理与实现
蓝桥大使【算法赛】----贪心算法 wyshh119 算法学习贪心算法
这里比较的难点在于sort排序的根据是什么，为什么是两人的报酬差，我的理解是当两人报酬差越大，那么总报酬的损失就越大，其实是缺少具体的证明的，但是通过就说明确实是这样。也就不深究证明了。#include#includeusingnamespacestd;longlongans=0;constintN=100005;structnode{//结构体inta;intb;};nodea[N];intma
网络管理 Introducing Meraki – Your Complete Network Management S AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Meraki网络管理平台是一款专为企业级网络管理员设计的网络安全解决方案。它帮助用户轻松管理和监控其组织中的所有网络设备、VLANs及其设置。Meraki网络管理平台包括许多内置功能，如集中管理，安全，可视化分析等。此外，Meraki还提供强大的RESTAPI接口，开发者可以利用这些API来定制属于自己的应用。通过将现有工具、流程和工具合成为一体的网络管理解决方
理解 Node.js 中的 process`对象与常用操作 red润前端 node.js 前端 javascript
理解Node.js中的process对象与常用操作在Node.js中，process是一个全局对象，提供了与当前Node.js进程相关的信息和操作。无论是获取进程信息、处理信号、访问环境变量，还是控制进程行为，process都是不可或缺的工具。看到process不犯怵了1.获取进程信息process提供了许多属性和方法来获取当前进程的信息。process.pid：获取当前进程的PID（进程ID）。
npm详解：掌握 Node.js 包管理的艺术 Lv_Jin_Gang npm
在现代软件开发领域，包管理和依赖处理是任何项目不可或缺的一部分。对于基于Node.js的应用程序而言，NPM（NodePackageManager）不仅是安装和管理第三方库的标准工具，也是发布、共享和重用代码片段的核心平台。本文将深入探讨NPM的各个方面，从基础概念到高级用法，旨在为你提供一个全面而深入的理解。一、NPM简介与安装1.1NPM的诞生与重要性NPM伴随着Node.js的诞生而出现，它
Hive常用函数 - abs Called_Kingsley Hive hive 函数
Hive常用函数-abs官方解释abs(x)-returnstheabsolutevalueofx个人理解就是返回函数括号内数字的绝对值。想要获取该数的绝对值的时候就用这个函数没错使用示例selectabs(-1);>1官方示例abs(x)-returnstheabsolutevalueofxExample:>SELECTabs(0)FROMsrcLIMIT1;0>SELECTabs(-5)FRO
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

8个优秀的预训练模型，帮助您开始使用自然语言处理（NLP）

为什么要使用预训练模型？

本文涵盖的预训练NLP模型

多用途NLP模型

ULMFiT

有关ULMFiT的更多信息，请参阅：

Transformer

学习和阅读更多有关Transformer的资源：

谷歌的BERT

学习和阅读更多有关BERT的资源：

谷歌的Transformer-XL

有关学习和阅读有关Transformer-XL的更多信息的资源：

OpenAI的GPT-2

有关学习和阅读有关GPT-2的更多信息的资源：

Word嵌入

ELMO

学习和阅读有关ELMo的更多信息的资源：

Flair

学习和阅读更多有关Flair的资源：

其他预训练模型

StanfordNLP

学习和阅读更多有关StanfordNLP的资源：

你可能感兴趣的:(NLP,NLU,NLI,自然语言处理,理解,推理)