叶锦鲤

如何借助数据集更好的评估NLP模型的性能？

随着信息时代的迅猛发展，每天有无数文本、声音、图片和视频不断涌入互联网。如何从海量数据中提炼有意义信息成为学术界和工业界迫切需要解决的问题。在此背景下，自然语言处理（NLP）应运而生，成为人工智能领域最为活跃的研究领域之一。

NLP的目标是让计算机理解和生成人类语言，从而实现与人自然交流。这包括了基础的语言理解任务，如词性标注、句法分析，以及更复杂的应用，如情感分析、机器翻译和语音识别等。为了让机器更好地理解人类语言，研究者们开发了大量的算法和模型。然而，无论算法多么先进，如果没有大规模、高质量的数据支持，其效果都会受限。这就是为什么数据集在NLP领域如此至关重要。

数据集是NLP研究的基石，它们为研究者提供了评估和验证算法性能的基准，也是训练机器学习模型的关键资源。随着NLP领域的不断进展，涌现出大量数据集，涵盖了从基础到前沿的各种NLP任务。选择适当的数据集对于研究的成功至关重要。

在本文中，我们将详细介绍多种当前热门的NLP数据集。这些数据集包括文本分类、命名实体识别、机器翻译等各种任务。我们希望通过这篇文章，让您全面了解NLP数据集，以便为您的研究或项目选择合适的数据集提供指导。

一

数据集评估维度及其重要性

随着NLP领域的不断发展，出现了众多开源数据集，以支持各种研究任务。在选择和使用这些数据集时，了解它们的各种关键维度至关重要，这些维度不仅帮助我们理解数据集的特点和用途，还为我们提供了评估其适用性和质量的依据。以下是一些关键维度：

首先，我们应该了解数据集的名称和发布者。数据集的名称是其独特标识，有助于查找和引用。同时，了解数据集的发布者有助于评估数据集的可靠性和权威性。通常，来自知名机构或研究组的数据集更具可信度和认可度。

其次，我们需要了解数据集的内容、特点以及其对行业的影响。根据数据集的内容和特点，我们可以确定数据集适用的NLP任务类型，并了解数据集的设计目标和要求。这有助于判断数据集是否适合特定的研究或应用，以满足特定需求和挑战。此外，了解数据集的影响力可以告诉我们它在某些任务或领域中的广泛使用程度以及已被验证有效的程度。

此外，数据集的数据量和数据来源也是关键信息。数据量是评估数据集规模和深度的关键因素。大规模的数据集通常更适合用于训练复杂的模型，而小规模的数据集可能更适合特定任务或快速实验。了解数据的来源，即数据是如何生成和收集的，有助于评估其可靠性和代表性。选择来源可靠、具有代表性的数据集可以帮助避免偏见和误差。

综合而言，深入了解数据集的各个关键维度对于评估其适用性、可靠性和质量至关重要。选择合适的数据集是确保研究或项目成功的基础，因此我们应该花时间仔细研究并理解这些维度，以做出明智的决策。

二

NLP任务分类与数据集推荐的你

自然语言处理领域包含了多个子领域和任务，为了帮助研究者和开发者更便捷地找到适用于他们需求的数据集，我们将根据不同的NLP任务进行分类，并为每个任务推荐相关的数据集。

问答任务

问答任务主要关注模型对特定问题的答案生成或选择能力。

1.1 二值问题回答

这是一个特定类型的问题回答任务，主要关注于二值（是/否）答案。

推荐数据集：

BoolQ：由Google AI发布，是一个二值问题（是或否的问题）及其答案，包含约超过9k条数据，来源于从Wikipedia抽取。

下载地址（https://huggingface.co/datasets/boolq）

1.2 对话式问答

这是一个涉及对话上下文的问题回答任务。

推荐数据集：

CoQA：由斯坦福大学发布，是一个对话式的问答数据集，包含约12.7w+个问题答案对，来源于不同的来源，如维基百科、小说、新闻等。
下载地址（https://stanfordnlp.github.io/coqa/）

1.3 开放领域的问答

这个任务要求模型回答开放领域的问题。

推荐数据集：

WebQA：由百度发布，是一个开放领域的问答数据集，包含约42k个问题和566k个问题相关文本条数据，来源于基于Web的问答对。
下载地址（https://huggingface.co/datasets/suolyer/webqa）
TriviaQA：由University of Washington发布，是一个开放领域的问题和答案对，包含约65w条数据，来源于TriviaQA网站和其他Trivia游戏。

下载地址（https://huggingface.co/datasets/trivia_qa）

1.4 信息寻求对话

这个任务涉及与模型进行对话，以获得特定信息。

推荐数据集：

QuAC：由Allen Institute of Artificial Intelligence & DARPA CwC program发布，是一个模拟学生与教师之间的信息寻求对话，包含约1.4w多对话条数据，来源于隐藏的维基百科文本。

下载地址（https://huggingface.co/datasets/quac）

语言理解

2.1 预测段落最后一个单词

本任务用于评估模型对文本生成和连续性的理解。

推荐数据集：

LAMBADA：由University of Amsterdam&University of Trento发布，是一个预测文本的下一个词，包含约12,684条数据，来源于书籍和其他文学作品。

下载地址（https://huggingface.co/datasets/lambada/tree/main）

2.2 故事结束预测

这个任务需要模型预测故事的可能结束。

推荐数据集：

StoryCloze：由University of Rochester发布，是一个预测故事的正确结尾，包含约超过3,700条数据，来源于故事文本。

下载地址（https://huggingface.co/datasets/story_cloze）

2.3 阅读理解

阅读理解任务要求模型从给定的文本中提取或推断信息。

推荐数据集：

RACE：由CMU发布，是一个英语阅读理解数据集，包含约超过2.8w篇文章和近10w个问题，来源于中国的英语考试。
下载地址（https://www.cs.cmu.edu/~glai1/data/race/）
RACE-Middle：由CMU发布，是一个初中级阅读理解题目，包含约25,421条数据，来源于中国中学生英语考试。
下载地址（https://huggingface.co/datasets/race）
RACE-High：由CMU发布，是一个高中级阅读理解题目，包含约62,445条数据，来源于中国中学生英语考试。
下载地址（https://huggingface.co/datasets/race）
SQUADv2：由斯坦福大学发布，是一个阅读理解任务。该数据集包含约15w+个问题答案对，还有一些没有答案的问题。数据来源是维基百科，由众包人员对抗生成。
下载地址（https://huggingface.co/datasets/squad_v2）
CMRC2018：由哈工大讯飞联合实验室发布，是一个中文阅读理解任务，包含约近2w个真实问题条数据，来源于人类专家在维基百科的段落中注释。

下载地址（https://github.com/ymcui/cmrc2018）

2.4 多模态语言理解

这个任务关注于结合多种模式（如文本、图像和声音）来理解语言。

推荐数据集：

MMLU：由UC Berkele&Columbia University&Uchicago&UIUC发布，是一个多模态语言理解数据集，包含约5,822,552条数据，来源于研究生和本科生从免费的在线来源手动收集。包括研究生学历考试和美国医学执照考试等考试的练习题、为本科生课程设计的问题和为牛津大学出版社书籍读者设计的问题。

下载地址（https://huggingface.co/datasets/cais/mmlu）

推理模块

3.1常识推理

常识推理是测试模型对常识和逻辑的理解能力的任务。这个任务要求模型具备尝试推理能力，理解和推理因果关系。

推荐数据集：

HellaSwag：由University of Washington发布，是一个常识推理数据集，要求模型预测句子的正确结尾，包含约超过70,000条数据，来源于来自各种源，如教学视频、故事，但由研究人员进行修改。
下载地址（https://huggingface.co/datasets/hellaswag）
WinoGrande：由University of Washington发布，是一个常识推理挑战，基于Winograd模式，包含约44,000条数据，来源于人工构建。
下载地址（https://huggingface.co/datasets/winogrande/tree/main）
COPA：由Indiana University & University of Southern California发布，是一个评估模型在开放领域常识因果推理的进展，包含约1000个选择问题条数据，来源于人工设计。
下载地址（https://people.ict.usc.edu/~gordon/copa.html）
CSQA：由CommonsenseQA团队发布，是一个需要常识知识来回答的问答数据集，包含约20,000篇对话，大约1.6M个QA对，来源于注释员相互交流生成。
下载地址（https://amritasaha1812.github.io/CSQA/download/）

3.2 自然语言推理

这个任务要求模型根据给定的前提推断出结论。

推荐数据集：

ANLI：由Facebook AI发布，是一个人工生成的自然语言推理数据集，包含约超过120,000条数据，来源于众包平台。
下载地址（https://huggingface.co/datasets/anli）
XNLI：由Facebook AI发布，是一个多语言自然语言推理数据集，包含约超过390,000条数据，来源于15种语言的翻译。
下载地址（https://huggingface.co/datasets/xnli）
StrategyQA：由Tel Aviv University、Allen Institute for AI & University of Pennsylvania发布，是一个需要对多个证据进行推理的问答数据集，包含约约2700样例，来源于workers生成。
下载地址（https://storage.googleapis.com/ai2i/strategyqa/data/strategyqa_dataset.zip）
GLUE的MNLI、QNLI和 WNLI子数据集：GLUE是由纽约大学和华盛顿大学发布，是一个一组用于评估和分析多种NLP任务的数据集，包含约一共多个任务，不同任务有不同的数据量条数据，来源于各种NLP数据集的集合。
下载地址（https://gluebenchmark.com/）

3.3 深度推理

这个任务要求模型进行更深入的推理以回答问题。

推荐数据集：

DROP：由Allen Institute for Artificial Intelligence发布，是一个需要深入推理的问答数据集，包含约77,409个问题答案对，来源于从维基百科中选择的段落。

下载地址（https://opendatalab.com/DROP/download）

3.4 数学推理

数学推理任务测试模型在数学问题上的推理能力。

推荐数据集：

GSM8K：由OpenAI发布，是一个由8.5K高质量的语言多样化的小学数学单词问题组成的数据集，包含约8500个问题条数据，来源于人类创造。
下载地址（https://github.com/openai/grade-school-math）
MATH：由UC Berkeley和UChicago发布，是一个初级代数、代数、计数与概率、数论与微积分等数学题，包含约12500道数学题条数据，来源于美国中学数学竞赛试题。
下载地址（https://huggingface.co/datasets/math_dataset）
Math23k：由Tencent AI Lab发布，是一个数学问题解决数据集，包含约约23,000个问题条数据，来源于从中文网站收集的数学题。
下载地址（https://ai.tencent.com/ailab/nlp/dialogue/datasets/Math_data.zip）

3.5 科学推理

科学推理任务要求模型对科学概念和事实进行推理。

推荐数据集：

ARC-Challenge：由AI2发布，是一个科学问题及其答案，需要深入推理，包含约2590条数据，来源于学科教育资源。
下载地址（https://huggingface.co/datasets/vietgpt/ARC-Challenge_en）
ARC：由AI2发布，是一个数据集分为简单和挑战两部分，包含约7787个问题，来源于学生科学挑战中的问题。
下载地址（https://opendatalab.com/ARC/download）
PIQA：由University of Washington&AI2发布，是一个针对物理互动的问题回答，包含约超过16,000条数据，来源于众包产生。

下载地址（https://huggingface.co/datasets/piqa/tree/main）

文本生成

文本生成任务是指让机器自动产生连贯、有意义的文本，通常基于给定的上下文或提示。代码生成也属于此列。

推荐数据集：

Wikitext103: 由Salesforce研究发布，是一个包含100多万的维基百科文章令牌，包含约103M令牌条数据，来源于维基百科的顶级文章。
下载地址（https://huggingface.co/datasets/wikitext）
PG19: 由DeepMind发布，是一个古腾堡书籍中1919年前出版制品集合，包含约28752篇文章条数据，来源于项目古腾堡。
下载地址（https://huggingface.co/datasets/pg19）
C4: 由DeepMind发布，是一个清洁的、多语言的数据集，包含约数百万篇文章，数十亿的令牌条数据，来源于网络爬取数据。
下载地址（https://huggingface.co/datasets/c4）
HumanEval：由OpenAI、Anthropic AI发布，是一个评估AI模型的问题解决能力，包含约164个手写编程问题，平均每个问题有7.7个测试条数据，来源于Openai员工手写。

下载地址（https://huggingface.co/datasets/openai_humaneval）

基础任务类

5.1句子对比

这个任务关注于比较两个句子的语义相似性或差异性。

推荐数据集：

PAWS-X：由Google Research发布，是一个多语言对比词序数据集，包含约49,401条数据，来源于Wikipedia和其他源的翻译。
下载地址（https://huggingface.co/datasets/paws-x）
LCQMC：由哈尔滨工业大学发布，是一个判断中文句子对是否具有相同的意图，包含约238,766个句子对条数据，来源于社交媒体平台、问答网站等。

下载地址（https://opendatalab.com/LCQMC/download）

5.2 词义消歧

这个任务关注于确定一个词在特定上下文中的正确含义。

推荐数据集：

WiC：由卡迪夫大学发布，是一个词义消歧的数据集，判断两个句子中的同一个词是否有相同的意思，包含约5428个问题条数据，来源于多语言资源。

下载地址（https://pilehvar.github.io/wic/）

5.3 代词消除歧义

这个任务关注于正确解决代词的歧义。

推荐数据集：

WSC：由Winograd Schema Challenge组织发布，是一个代词消除歧义，包含约285个问题条数据，来源于专家编写。

下载地址（https://huggingface.co/datasets/winograd_wsc）

5.4 文本蕴含

这个任务要求模型确定一个文本是否蕴含另一个文本。

推荐数据集：

GLUE的RTE子集

5.5 情感分析

情感分析任务旨在确定文本的情感倾向。

推荐数据集：

GLUE的SST-2 子集

其他

6.1 真实性评估

这个任务用于评估生成的回答的真实性。

推荐数据集：

Truthful-QA: 由University of Oxford&Open AI发布，是一个评估生成回答的真实性的数据集，包含约817条数据，来源于作者自编。下载地址（https://huggingface.co/datasets/truthful_qa）

6.2 评估刻板印象

这个任务旨在评估模型是否持有或传递某些刻板印象。

推荐数据集：

ETHOS：由Aristotle University of Thessaloniki发布，是一个包含刻板印象的语句及未包含的语句，包含约二分类任务有998条评论，多分类有433条评论条数据，来源于YouTube和Reddit评论。
下载地址（https://huggingface.co/datasets/ethos）
StereoSet：由MIT、Intel AI、Facebook CIFAR AI Chair and McGill University发布，是一个包含刻板印象的语句及未包含的语句，包含约17000个句子条数据，来源于不同的文本来源。

下载地址（https://huggingface.co/datasets/stereoset）

6.3 多任务评估

多任务评估关注于同时评估模型在多个任务上的性能。

推荐数据集：

SuperGLUE：由AI2 & University of Washington发布，是一个一组NLP任务的基准，是GLUE的扩展，包含约不同任务有不同数据量条数据，来源于多个NLP数据集的集合。
下载地址（https://huggingface.co/datasets/super_glue/tree/main）
BIG-bench：BIG-bench由Google发布，是一个大规模语言模型评估基准。该数据集包含多个子任务，但总数不详。数据来源于不同的子任务来源。
下载地址（https://github.com/google/BIG-bench）

以上是基于不同NLP任务的数据集推荐。每个数据集都有其特定的特点和用途，研究者和开发者应根据自己的需求和研究目标选择合适的数据集。同时，随着NLP领域的不断进展，可能会有更多的数据集和任务出现，我们应持续关注并不断更新我们的知识库。

三

结论

数据集在自然语言处理领域中起到了至关重要的作用。无论是为了训练强大的模型，还是为了验证新的算法和策略，数据集都是不可或缺的资源。在本文中，我们介绍了43个NLP数据集，涵盖了从常识推理到问题回答的各种任务。每个数据集都有其独特的特点和应用场景，为研究者提供了丰富的选择。

但要注意，选择数据集不仅仅是根据其大小或者知名度。重要的是要确保数据集与研究或项目的目标相匹配。此外，数据集的质量、多样性和代表性也是需要考虑的关键因素。一个好的数据集应该能够为模型提供全面、均衡和有代表性的训练数据。

随着NLP领域的不断进展，我们预期未来还会有更多的数据集问世。而随着技术的进步，数据集的规模、质量和多样性也可能会得到进一步的提高。因此，研究者和开发者应始终保持警觉，关注最新的数据集和研究动态，确保他们的工作始终处于行业的前沿。

最后，我们鼓励读者深入探索上文提到的数据集，并挑战更多的NLP任务。希望这篇文章能为您提供一些有用的参考和启示，助您在NLP领域取得更大的成功。

欢迎关注微软智汇AI 官方账号

一手资讯抢先了解

点击“阅读原文” | 了解更多 AI 赋能案例

《今日AI-人工智能-编程日报》-源自2025年3月21日小亦编辑部人工智能
一、AI编程领域最新动态AI编程工具崛起，程序员职业面临挑战Anthropic首席执行官DarioAmodei预言，未来一年内，90%的代码将由AI生成，传统程序员的工作可能被大幅替代。最新发布的AI编程模型（如Claude3.7、Sonnet3.7）在初级开发评估中表现优异，得分率超过60%，部分模型甚至在全球程序员排名中位列前0.1%。字节跳动的Trae海外版接入Claude3.7和GPT-4
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
普通人学习AI应该如何入手？2025年最新AI大模型学习路线+全套学习资料，适合新手小白！小城哇哇人工智能学习大数据语言模型 AI大模型 agi ai
引言随着人工智能（AI）技术的飞速发展，越来越多的人开始意识到掌握这项技能的重要性。然而，对于许多没有编程背景或数学基础的人来说，进入AI领域似乎是一个遥不可及的梦想。但实际上，通过合理的规划和适当的学习资源，任何人都可以逐步掌握AI的核心知识，并应用到实际工作中去。本文将为普通读者提供一份详细的2025年最新AI大模型学习路线图，并附带一套完整的自学资料，帮助您从零基础起步，顺利开启AI学习之旅
知识蒸馏：让大模型“瘦身“而不失智慧的魔术一休哥助手人工智能人工智能
引言：当AI模型需要"减肥"在人工智能领域，一个有趣的悖论正在上演：大模型的参数规模每年以10倍速度增长，而移动设备的算力却始终受限。GPT-4的1750亿参数需要价值500万美元的GPU集群运行，但现实中的智能设备可能只有指甲盖大小。这种矛盾催生了一项神奇的技术——知识蒸馏（KnowledgeDistillation），它就像给AI模型进行"脑外科手术"，将庞然大物的智慧浓缩到轻量模型中。第一章
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
使用大语言模型API在AI应用中的实现 qq_37836323 人工智能语言模型自然语言处理 python
随着人工智能技术的迅速发展，大语言模型（LLM）在自然语言处理（NLP）领域的应用越来越广泛。本文将介绍如何使用大语言模型API来实现一些基础的AI应用，并提供一个简单的demo代码，帮助大家更好地理解和使用这些技术。大语言模型API简介大语言模型（如GPT-4）能够理解和生成类似人类的文本。这些模型可以应用于各种任务，包括文本生成、语言翻译、情感分析、对话系统等。为了方便国内用户访问这些强大的模
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
【NLP】 API在大语言模型中的应用 Nerous_ 深度学习自然语言处理语言模型人工智能
大语言模型（LargeLanguageModels,LLMs）通过API（应用程序接口）为开发者提供了便捷的调用方式，使其能够快速集成自然语言处理能力到各类应用中。以下是API在LLM中的核心应用场景及技术实现细节：一、核心应用场景自然语言理解与生成应用示例：智能客服：解析用户问题并生成回复（如ChatGPTAPI）。内容创作：自动生成文章、广告文案或代码（如OpenAI的GPT-4）。技术实现：
存算一体与存算分离：架构设计的深度解析与实现方案克里斯蒂亚诺罗纳尔多阿维罗大数据数据库
随着数据量的不断增大和对计算能力的需求日益提高，存算一体作为一种新型架构设计理念，在大数据处理、云计算和人工智能等领域正逐步引起广泛关注。在深入探讨存算一体之前，我们需要先了解存储和计算的基本概念，以及存算分离和存算一体之间的区别。什么是存算一体？存算一体，顾名思义，是将数据存储与计算资源紧密结合，形成一个统一的架构。在这种架构下，存储和计算不仅在物理层面上结合，更在架构设计上深度融合。具体来说，
自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期|数商云数商云网络 B2B系统数字化电商平台人工智能大数据云计算数据库运维 java spring
引言在数字经济时代，B2B（Business-to-Business）电子商务正在以前所未有的速度改变着企业的运营模式。随着交易量的不断攀升，传统的合同生成和审核流程逐渐成为制约交易效率的瓶颈。然而，随着人工智能（AI）技术的飞速发展，结合B2B系统的智能化升级，我们正见证一场合同生成效率的革命。本文将深入探讨“30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期”这一创新模式，解析其背后的
【北京迅为】iTOP-RK3568开发板OpenHarmony系统南向驱动开发UART接口运作机制迅为电子 RK3568开发板 RK3568开发板 OpenHarmony
瑞芯微RK3568芯片是一款定位中高端的通用型SOC，采用22nm制程工艺，搭载一颗四核Cortex-A55处理器和MaliG522EE图形处理器。RK3568支持4K解码和1080P编码，支持SATA/PCIE/USB3.0外围接口。RK3568内置独立NPU，可用于轻量级人工智能应用。RK3568支持安卓11和linux系统，主要面向物联网网关、NVR存储、工控平板、工业检测、工控盒、卡拉OK
大学期间如何学习利用AI der丸子吱吱吱学习人工智能
一、引言人工智能（AI）是当今世界技术发展的重要方向，它已经渗透到医疗、金融、交通、娱乐等各个领域。随着AI技术的快速发展，它不仅改变了我们的生活，也带来了巨大的职业机会。然而，面对如此广阔的领域，作为大学生，如何在本科阶段有效地学习和利用AI，成了许多同学的困惑。本文将详细介绍大学生在本科阶段如何通过合理的学习路线、方法和工具，逐步掌握AI的核心技术，并为日后进入AI行业打下坚实的基础。通过这篇
全面掌握Python：从安装到基础再到进阶的系统学习之路（附代码，建议新手收藏） der丸子吱吱吱 python 学习开发语言新手入门代码
Python，作为一种现代化的高级编程语言，因其简洁易懂的语法和强大的功能，成为了数据科学、人工智能、Web开发等多个领域的首选语言。在这篇文章中，我们将从大学课本的结构来详细介绍Python，帮助大家从零基础开始，逐步深入掌握Python的各个方面。目录第一章：Python简介与安装1.1Python语言概述1.2安装Python1.3Python的开发环境1.4第一个Python程序第二章：基
yum install locate出现Error: Unable to find match: locate解决方案爱编程的喵喵 Linux解决方案 linux locate yum 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了yuminstalllocate出现
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
模型上下文协议 (MCP)是什么？Model Context Protocol 需要你了解一下同学小张学习 AIGC AI-native agi gpt 开源协议
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，订阅我的大模型专栏，共同学习和进步。在人工智能领域，ModelContextProtocol（MCP）正逐渐成为连接AI模型与各类数据源及工具的重要标准。MCP究竟为何物？它又将如何改变AI应用的开发与使用？文章目录0.概念1.MCP的总体架构2.为何使用MCP？3.我的理解4
生成式对抗网络在人工智能艺术创作中的应用与创新研究辛迎蕌人工智能
摘要本文深入探究生成式对抗网络（GAN）在人工智能艺术创作领域的应用与创新。通过剖析GAN核心原理，阐述其在图像、音乐、文学等艺术创作中的实践，分析面临的挑战与创新方向，呈现GAN对艺术创作模式的变革，为理解人工智能与艺术融合发展提供全面视角。一、引言在人工智能与艺术深度融合的时代浪潮中，生成式对抗网络（GAN）作为一项突破性技术，为艺术创作带来了全新的可能性。它打破传统创作边界，以独特的对抗学习
知识图谱在人工智能语义理解与推理中的关键作用及发展研究 @王威& 人工智能
摘要本文聚焦知识图谱，深入剖析其在人工智能语义理解与推理中的核心作用。阐述知识图谱的构建原理、表示方法，分析其在自然语言处理、智能问答系统、推荐系统等多领域助力语义理解与推理的应用，探讨面临的挑战并展望未来发展方向，全面呈现知识图谱对人工智能发展的重要价值与深远影响。一、引言在人工智能追求更精准理解和处理人类语言与知识的进程中，知识图谱成为关键技术。它以结构化形式组织海量知识，揭示实体间复杂关系，
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
AI人工智能 Agent：在赋能传统行业中的应用 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：在赋能传统行业中的应用1.背景介绍1.1人工智能的发展历程1.1.1人工智能的起源与发展1.1.2人工智能的三次浪潮1.1.3人工智能的现状与挑战1.2传统行业面临的困境1.2.1效率低下1.2.2成本高企1.2.3决策滞后1.3人工智能赋能传统行业的必要性1.3.1提高效率1.3.2降低成本1.3.3优化决策2.核心概念与联系2.1人工智能Agent的定义2.1.1Age
《深度剖析：BERT与GPT——自然语言处理架构的璀璨双星》人工智能深度学习
在自然语言处理（NLP）的广袤星空中，BERT（BidirectionalEncoderRepresentationsfromTransformers）与GPT（GenerativePretrainedTransformer）系列模型宛如两颗最为耀眼的星辰，引领着NLP技术不断迈向新的高度。它们基于独特的架构设计，以强大的语言理解与生成能力，彻底革新了NLP的研究与应用范式，成为学界和业界竞相探索
“四预”驱动数字孪生水利：让智慧治水守护山河安澜 GeoSaaS 实景三维智慧城市人工智能 gis 大数据安全
近年来，从黄河秋汛到海河特大洪水，从珠江流域性洪灾到长江罕见骤旱，极端天气频发让水安全问题备受关注。如何实现“治水于未发”？数字孪生水利以“预报、预警、预演、预案”（四预）为核心，正在掀起一场水利治理的智慧革命。一、数字孪生水利：从物理世界到虚拟镜像的跃迁数字孪生水利并非简单的“数字建模”，而是通过高精度传感器、大数据、人工智能等技术，在虚拟空间构建与物理流域完全映射的“数字分身”，实现水情、工情
硬件NAS将成为电子垃圾？ DeepSeek+NAS 家用NAS WinNAS 飞牛NAS 人工智能安卓NAS
随着人工智能（AI）技术的快速发展，传统的NAS设备正面临一场深刻的变革。过去，NAS的主要功能是提供数据存储和共享服务，但在AI时代，单纯的存储功能已无法满足用户需求。未来的NAS必须集成本地AI能力，才能成为真正的AI-NAS。然而，当前市场上的NAS产品硬件配置普遍较低，无法支持本地AI的运行。因此，现有的硬件NAS在三年内可能会被淘汰，取而代之的将是集成了AI和NAS功能的家用AI服务器。
【DeepSeek】全方位使用指南————简版諰. 人工智能 ai AI写作
一、平台概述DeepSeek（深度求索）是专注实现AGI的中国的人工智能公司，提供多款AI产品：智能对话（Chat）文生图（Art）代码助手（Coder）API开发接口企业定制解决方案二、注册与登录2.1账号创建访问官网https://www.deepseek.com点击右上角「注册」支持三种方式：手机号+短信验证邮箱注册（需验证邮件）第三方登录（微信/Google账号）2.2订阅计划套餐类型免费
【人工智能】注意力机制深入理解问道飞鱼机器学习与人工智能人工智能注意力机制
文章目录**一、注意力机制的核心思想****二、传统序列模型的局限性****三、Transformer与自注意力机制****1.自注意力机制的数学公式****四、注意力机制的关键改进****1.稀疏注意力（SparseAttention）****2.相对位置编码（RelativePositionEncoding）****3.图注意力网络（GraphAttentionNetwork,GAN）****
Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
使用 OpenAI Chat 模型进行对话开发的入门指南 eahba python
技术背景介绍OpenAI的对话模型（ChatOpenAI）为开发者提供了强大的自然语言处理功能，可以实现高度交互的AI应用。这篇文章将帮助您快速入门，了解如何在您的应用中集成和使用这些模型，并探讨不同的功能特性。核心原理解析ChatOpenAI模型是基于OpenAI的GPT家族，能够理解上下文并产生对话式回应。最新版的模型不仅支持标准文本输入输出，还支持工具调用、结构化输出等高级特性，满足多种复杂
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

如何借助数据集更好的评估NLP模型的性能？

你可能感兴趣的:(自然语言处理,人工智能)