Sonhhxg_柒

【NLP】第13章用Transformers分析假新闻

大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流

个人主页－Sonhhxg_柒的博客_CSDN博客

欢迎各位→点赞 + 收藏⭐️ + 留言

系列专栏 - 机器学习【ML】自然语言处理【NLP】深度学习【DL】

foreword

✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。

如果你对这个系列感兴趣的话，可以关注订阅哟

我们生来就认为地球是平的。作为婴儿，我们在平坦的表面上爬行。作为幼儿园的孩子，我们在平坦的操场上玩耍。在小学，我们坐在平坦的教室里。然后，我们的父母和老师告诉我们，地球是圆的，地球另一边的人是颠倒的。我们花了很长时间才明白为什么它们没有从地球上掉下来。即使在今天，当我们看到美丽的日落时，我们仍然看到的是“日落”，而不是地球自转远离太阳！

弄清楚什么是假新闻，什么不是假新闻需要时间和精力。像孩子一样，我们必须努力解决我们认为是假新闻的事情。

本章将讨论一些引起紧张的话题。我们将检查有关气候变化、枪支管制和唐纳德特朗普推文等主题的事实。我们将分析推文、Facebook 帖子和其他信息来源。

我们的目标当然不是评判任何人或任何事。假新闻涉及观点和事实。新闻往往取决于当地文化对事实的看法。我们将提供想法和工具来帮助其他人收集有关某个主题的更多信息，并在我们每天收到的信息丛林中找到自己的方式。

我们将关注道德方法，而不是变形金刚的表现。出于这个原因，我们不会使用 GPT-3 引擎。我们并没有取代人类的判断。相反，我们正在为人类提供手动做出自己判断的工具。GPT-3 引擎在许多任务中都达到了人类水平的性能。但是，我们应该将道德和伦理决策留给人类。

因此，首先，我们将首先定义导致我们对假新闻做出情感和理性反应的路径。

然后，我们将定义一些方法来使用转换器和启发式方法来识别假新闻。

我们将使用我们在前几章中建立的资源来理解和解释假新闻。我们不会评判。我们将提供解释新闻的变压器模型。有些人可能更喜欢创建一个通用的绝对转换器模型来检测和断言一条消息是假新闻。

我选择用变形金刚来教育用户，而不是给他们讲课。这种方法是我的意见，不是事实！

本章涵盖以下主题：

认知失调
对假新闻的情绪反应
假新闻的行为表征
对假新闻的理性处理
假新闻解决路线图
将情绪分析转换器任务应用于社交媒体
使用 NER 和 SRL 分析枪支控制观念
使用变压器提取的信息寻找可靠的网站
使用变压器产生用于教育目的的结果
如何以客观但批判的眼光阅读前总统特朗普的推文

我们的第一步将是探索对假新闻的情感和理性反应。

对假新闻的情绪反应

人类行为对我们的社会、文化和经济决策产生巨大影响。我们的情绪对我们的经济的影响不亚于理性思维。行为的经济驱动着我们的决策过程。我们购买我们身体需要的消费品并满足我们的情感需求。我们甚至可能会在当下的热潮中购买智能手机，尽管它超出了我们的预算。

我们对假新闻的情感和理性反应取决于我们是缓慢思考还是对传入信息快速反应。Daniel Kahneman在他的研究和著作《思考，快与慢》（2013 年）中描述了这一过程。

他和弗农·L·史密斯因行为经济学研究获得诺贝尔经济学奖。行为驱动我们以前认为是理性的决定。不幸的是，我们的许多决定都是基于情绪，而不是理性。

让我们将这些概念转化为应用于假新闻的行为流程图。

认知失调引发情绪反应

认知失调将假新闻推上推特、脸书和其他社交媒体的顶级行列媒体平台。如果每个人都同意一条推文的内容，什么都不会发生。如果有人在推特上说“气候变化很重要”，没有人会做出反应。

当我们脑海中相互矛盾的想法之间的紧张关系加剧时，我们就会进入认知失调状态。结果，我们变得紧张、烦躁，它就像烤面包机的短路一样使我们疲惫不堪。

我们有很多例子要考虑。当我们在户外时，是否需要佩戴带有 COVID-19 的口罩？封锁是好事还是坏事？冠状病毒疫苗有效吗？还是冠状病毒疫苗危险？认知失调就像一个音乐家在演奏一首简单的歌曲时不断犯错。它让我们发疯！

假新闻综合症成倍增加认知失调！一位专家会断言疫苗是安全的，而另一位专家会断言我们需要小心。一位专家说在外面戴口罩没用，另一位在新闻频道上断言我们必须戴口罩！双方都指责对方造谣！

一方面，假新闻的很大一部分似乎是另一方的真相。

现在是 2022 年，在 2020 年总统选举或即将举行的选举组织之后，美国共和党和民主党仍然无法就全国选举规则达成一致。

我们可以通过打开一份报纸然后阅读另一份对立报纸的另一种观点来继续寻找许多其他主题！然而，本章的一些常识性前提可以从这些例子中得出：

寻找能够自动检测假新闻的 Transformer 模型毫无意义。在社交媒体和多元文化表达的世界里，每个群体都有一种了解真相的感觉，而另一个群体则在表达假新闻。
试图将我们的观点表达为从一种文化到另一种文化的真理是没有意义的。在全球化的世界中，每个国家、每个大陆以及社交媒体中的每个地方的文化都各不相同。
假新闻绝对是一个神话。
我们需要找到对假新闻的更好定义。

我的观点（当然不是事实！）是假新闻是一种认知失调的状态，它只能是通过认知推理来解决。因此，解决假新闻的问题就像试图解决两方之间或我们自己头脑中的冲突一样。

在本章和生活中，我的建议是通过使用变压器模型解构冲突和想法来分析每个冲突张力。我们不是在“打击假新闻”、“寻找内心的平静”，或者假装使用变形金刚来寻找“反对假新闻的绝对真理”。

我们使用转换器来更深入地理解一系列单词（一条消息），从而对某个主题形成更深刻、更广泛的观点。

一旦完成，让变压器模型的幸运用户获得更好的愿景和意见。

为此，我将这一章设计为我们可以为自己和他人使用的课堂练习。变形金刚是加深我们对语言序列的理解、形成更广泛的观点和发展我们的认知能力的好方法。

让我们先看看当有人发布一条有冲突的推文时会发生什么。

分析有冲突的推文

以下推文是在 Twitter 上发布的一条消息（我转述了它）。此处显示的推文章节是原始数据集格式，而不是 Twitter 界面显示。如果一位主要政治人物或著名演员发推文，你可以肯定很多人会不同意该内容：

Climate change is bogus. It's a plot by the liberals to take the economy down.

它会引发情绪反应。推文会在四面八方堆积起来。它会像病毒一样流行起来！

让我们在转换器工具上运行推文，以了解这条推文如何在某人的脑海中引发认知失调风暴。

打开Fake_News.ipynb，我们将在本节中使用的笔记本。

我们将从艾伦人工智能研究所的资源开始。我们将运行我们在第 12 章“检测客户情绪以进行预测”中用于情感分析的 RoBERTa 转换器模型。

我们将首先安装allennlp-models：

!pip install allennlp==1.0.0 allennlp-models==1.0.0

AllenNLP 不断更新随着他们的进步版本。版本 2.4.0 在写作，但对本章提供的示例没有任何附加价值。更新的随机算法或模型可以从一个到另一个产生不同的输出。

然后我们使用 Bash 运行下一个单元格以详细分析 Tweet 的输出（关于模型和输出的信息）：

!echo '{"sentence":"Climate change is bogus. It's a plot by the liberals to take the economy down."}' | \
allennlp predict https://storage.googleapis.com/allennlp-public-models/sst-roberta-large-2020.06.08.tar.gz -

输出显示推文是否定的。正值为0，负值接近1：

"probs": [0.0008486526785418391, 0.999151349067688]

由于变压器是随机算法，因此输出可能会因运行而异。

我们将现在转到AllenNLP — Allen Institute for AI以获取分析的可视化表示。

输出可能会从一次运行更改为另一次。变压器模型不断训练和更新。本章的目标是专注于 Transformer 模型的推理。

我们选择情绪分析（AllenNLP - Demo）并选择运行分析的RoBERTa 大型模型。

我们得到相同的阴性结果。但是，我们可以进一步调查，看看哪些词影响了 RoBERTa 的决定。

转到模型解释。

解释模型将提供有关如何获得结果的见解。我们可以选择一个或查看三个选项：

简单梯度可视化：这种方法提供两种可视化。第一个计算梯度与输入相关的类的分数。第二个是从类和输入推断的显着性（主要特征）图。
集成梯度可视化：此模型不需要更改神经网络。
这动机是设计对用于生成梯度的梯度的调用将神经网络的预测归因于其输入。
平滑梯度可视化：这种方法使用输出计算梯度预测和输入。目的是识别特征输入。但是，添加了噪声以改进解释。

在本节中，转到模型解释，然后单击简单梯度可视化和解释预测以获得以下表示：

图 13.1：可视化前 3 个最重要的词

is+ bogus+plot主要影响负面预测。

在这一点上，您可能想知道为什么我们要通过这样一个简单的例子来解释认知失调。解释来自以下推文。

一位坚定的共和党人写了第一条推文。让我们打电话给会员Jaybird65。令他惊讶的是，一位共和党同胞在推特上发布了以下推文：

I am a Republican and think that climate change consciousness is a great thing!

这条推文来自我们将调用的成员Hunt78。让我们运行这句话Fake_News.ipynb：

!echo '{"sentence":"I am a Republican and think that climate change consciousness is a great thing!"}' | \
allennlp predict https://storage.googleapis.com/allennlp-public-models/sst-roberta-large-2020.06.08.tar.gz -

输出是肯定的，当然：

"probs": [0.9994876384735107, 0.0005123814917169511]

一场认知失调风暴正在Jaybird65他的脑海中形成。他喜欢Hunt78但不同意。他的脑子风暴愈演愈烈！Jaybird65如果您阅读随后出现在和之间的推文Hunt78，您会发现一些令人惊讶的事实，这些事实伤害了Jaybird65的感情：

Jaybird65并且Hunt78显然彼此认识。

如果你去他们各自的推特账号，你会发现他们都是猎人。
你可以看到他们都是坚定的共和党人。

Jaybird65最初的推文来自他对《纽约时报》一篇文章的反应，该文章称气候变化正在摧毁地球。

Jaybird65颇为不解。他看得出来，Hunt78就是像他这样的共和党人。他也是一个猎人。那么怎么能Hunt78相信气候变化呢？

这个 Twitter 线程继续发布大量愤怒的推文。

然而，我们可以看到，假新闻讨论的根源在于对新闻的情绪反应。应对气候变化的合理方法是：

不管是什么原因，气候都在变化。
我们不需要降低经济来改变人类。
我们需要继续建造电动汽车，在大城市增加步行空间，以及更好的农业习惯。我们只需要以最有可能产生收入的新方式开展业务。

但是人类的情感很强烈！

让我们代表从新闻到情感和理性反应的过程。

假新闻的行为表征

假新闻始于情绪反应、积累和经常导致人身攻击。

图 13.2表示当认知失调阻塞我们的思维过程时，对假新闻的三阶段情绪反应路径：

阶段 1：传入新闻

两个人或一群人对他们通过各自媒体获得的新闻做出反应：Facebook、Twitter、其他社交媒体、电视、广播、网站。每个信息来源都包含有偏见的意见。

第二阶段：共识

两个人或一组人可以同意或不同意。如果他们不同意，我们将进入第三阶段，在此期间冲突可能会爆发。

如果他们同意，共识就会阻止热度的增加，并且新闻被接受为real新闻。但是，即使各方都认为他们收到的消息不是假的，但这并不意味着它不是假的。以下是一些可以解释标记为not fake news假新闻的新闻：

12世纪初，欧洲大多数人都认为地球是宇宙的中心，太阳系围绕地球旋转。
1900 年，大多数人认为永远不会有飞机飞越海洋。
2020 年 1 月，大多数欧洲人认为 COVID-19 是一种仅影响中国而非全球大流行的病毒。

底线是，两方甚至整个社会之间的共识并不意味着传入的消息是真的还是假的。如果两方意见不一致，这将导致冲突：

图 13.2：从新闻到假新闻冲突路径的表示

面对现实吧。在社交媒体上，成员通常会与其他有相同想法的人聚在一起，无论如何都很少改变主意。这种表示表明，一个人通常会坚持他们在推文中表达的观点，一旦有人质疑他们的信息，冲突就会升级！

第三阶段：冲突

一条假新闻冲突可以分为四个阶段：

3.1：冲突始于分歧。各方将在 Facebook 或其他平台上发布推文或发布消息。几次交流后，冲突可能会逐渐消失，因为双方都对该话题不感兴趣。
3.2：如果我们回到和之间的气候变化讨论Jaybird65，Hunt78我们知道事情会变得很糟糕。谈话正在升温！
3.3：在某一时刻，不可避免地，一方的论点将成为假新闻。Jaybird65会生气并在许多推文中表现出来，并说人类造成的气候变化是假新闻。Hunt78会生气并说否认人类对气候变化的贡献是假新闻。
3.4：这些讨论往往以人身攻击告终。戈德温定律经常进入对话，即使我们不知道它是如何出现的。戈德温定律指出，一方会在谈话中的某一时刻找到最糟糕的参考来描述另一方。有时会出现“你们自由主义者就像希特勒一样试图通过气候变化迫使我们的经济下滑”。这种类型的消息可以在 Twitter、Facebook 和其他平台上看到。它甚至出现在关于气候变化的总统演讲中的实时聊天中。

有没有理性这些讨论的方法可以抚慰双方，让他们平静下来，至少达成一个中间立场共识，继续前进？

让我们尝试使用转换器和启发式方法构建一个合理的方法。

对假新闻的理性处理

变形金刚是最强大的 NLP 工具。本节将首先定义一个方法，可以将因假新闻而发生冲突的两方从情感层面提升到理性层面。

然后我们将使用转换器工具和启发式方法。在 COVID-19 大流行期间，我们将针对枪支管制和前总统特朗普的推文运行变压器样本。我们还将描述启发式可以用经典函数来实现。

您可以实现这些转换器 NLP 任务或您选择的其他任务。无论如何，路线图和方法可以帮助老师、父母、朋友、同事和任何寻求真相的人。因此，您的工作将永远是值得的！

让我们从包括变形金刚在内的假新闻的合理方法的路线图开始。

定义假新闻解决路线图

图 13.3定义了一个路线图进行合理的假新闻分析过程。该流程包含 Transformer NLP 任务和传统功能：

图 13.3：从情绪反应到假新闻再到理性陈述

我们看到，一旦情绪反应开始，理性过程几乎总是会开始。理性的过程必须尽快启动，以避免产生可能打断讨论的情绪反应。

第 3 阶段现在包含四个工具：

3.1：情感分析分析排名靠前的“情绪”正面或负面词。我们将使用AllenNLP资源来运行 RoBERTa 大型变压器我们的Fake_News.ipynb笔记本。我们将使用 AllenNLP 的可视化工具来可视化关键字和解释。我们在第 12 章“检测客户情绪以做出预测”中介绍了情绪分析。
3.2：命名实体识别( NER ) 从社交媒体消息中提取实体，用于阶段 3.4。我们在第 11 章中描述了 NER ，让您的数据说话：故事、问题和答案。我们将使用 Hugging Face 的 BERT 变换器模型任务。此外，我们将使用 AllenNLP.org 的可视化工具来可视化实体和解释。
3.3：语义角色标签( SRL ) 为阶段 3.4标记来自社交媒体消息的动词。我们在第 10 章“使用基于 BERT 的 Transformers 的语义角色标签”中描述了 SRL 。我们将使用 AllenNLP 的 BERT 模型Fake_News.ipynb。我们将使用 AllenNLP.org 的可视化工具来可视化标记任务的输出。
3.4：将描述对可靠网站的引用，以展示经典编码如何提供帮助。

让我们从枪支管制开始。

枪支管制辩论

第二修正案美国宪法规定了以下权利：

A well regulated Militia, being necessary to the security of a free State, the right of the people to keep and bear Arms, shall not be infringed.

几十年来，美国在这个问题上一直存在分歧：

一方面，许多人认为持有枪支是他们的权利，他们不想忍受枪支管制。他们争辩说，声称拥有武器会造成暴力是假新闻。
另一方面，许多人认为携带枪支是危险的，如果没有枪支管制，美国将仍然是一个暴力国家。他们争辩说，声称携带武器并不危险是假新闻。

我们需要帮助每一方。让我们从情绪分析开始。

情绪分析

如果您在演讲期间阅读推文、Facebook 消息、YouTube 聊天或任何其他社交媒体，您将看到各方正在打一场激烈的战斗。你不需要电视节目。你可以只吃爆米花，因为 Tweet 之战将各方撕裂！

让我们从一方获取一条推文，从另一方获取一条 Facebook 消息。我改了成员的名字并解释文本（考虑到消息中的侮辱，这不是一个坏主意）。让我们从亲枪推文开始：

专业枪支分析

这条推文是一个人的诚实意见：

Afirst78: I have had rifles and guns for years and never had a problem. I raised my kids right so they have guns too and never hurt anything except rabbits.

让我们跑这在Fake_News.ipynb：

!echo '{"sentence": "I have had rifles and guns for years and never had a problem. I raised my kids right so they have guns too and never hurt anything except rabbits."}' | \
allennlp predict https://storage.googleapis.com/allennlp-public-models/sst-roberta-large-2020.06.08.tar.gz -

预测是正面的：

prediction:  {"logits": [1.9383275508880615, -1.6191326379776], "probs": [0.9722791910171509, 0.02772079035639763]

我们现在将在 AllenNLP 上可视化结果。简单梯度可视化提供了一个解释：

图 13.4：句子的简单梯度可视化

解释表明，通过Afirst78亮点rifles++对推文进行and情感分析rabbits。

每次运行或随着时间的推移，结果可能会有所不同。这是因为变压器模型是不断训练和更新的。但是，本章的重点是过程，而不是具体的结果。

我们会挑选在每个步骤中提出想法和功能。Fake_News_FUNCTION_1是本节的第一个函数：

Fake_News_FUNCTION_1: rifles++可以提取并注明以供进一步分析and。rabbits在这个例子中，我们可以看到“步枪”并不“危险”。

我们现在将分析NYS99他的观点，即枪支必须受到控制。

枪支管制分析

NYS99: "I have heard gunshots all my life in my neighborhood, have lost many friends, and am afraid to go out at night."

我们先运行分析Fake_News.ipynb：

!echo '{"sentence": "I have heard gunshots all my life in my neighborhood, have lost many friends, and am afraid to go out at night."}' | \
allennlp predict https://storage.googleapis.com/allennlp-public-models/sst-roberta-large-2020.06.08.tar.gz -

结果自然是否定的：

prediction:  {"logits": [-1.3564586639404297, 0.5901418924331665], "probs": [0.12492450326681137, 0.8750754594802856]

让我们在线使用 AllenNLP 查找关键字。我们运行示例，可以看到平滑渐变可视化突出显示以下内容：

图 13.5：句子的平滑梯度可视化

该关键字afraid突出了本节的功能 2。我们现在知道“害怕”与“枪”有关。

我们可以看到该模型在解释这些认知失调时存在问题。我们人类的批判性思维仍然是必要的！

Fake_News_FUNCTION_2:afraid和guns（主题）可以提取并注明以供进一步分析。

如果我们现在将我们的两个函数并排放置，我们可以清楚地理解为什么两方互相争斗：

Fake_News_FUNCTION_1: rifles + and + rabbits
Afirst78可能住在美国中西部的一个州。其中许多州人口少，非常安静，犯罪率低。Afirst78可能从来没有到过大城市，享受在乡下安静生活的乐趣。

Fake_News_FUNCTION_2：afraid+主题guns
NYS99可能住在大城市或美国主要城市的更大区域。犯罪率通常很高，暴力是一种日常现象。NYS99可能从来没有去过中西部的州，看到过Afirst78生活。

这两个诚实而有力的观点证明了为什么我们需要实施本章中描述的解决方案。

更好的信息是减少假新闻斗争的关键。

我们将遵循我们的流程并将命名实体识别应用于我们的句子。

命名实体识别 (NER)

本章表明，通过使用多种变压器方法，用户将受益于更广泛的通过不同的角度感知信息。一个 HTML 页面可以总结本章的转换器方法，甚至可以包含生产模式下的其他转换器任务。

我们现在必须将我们的流程应用于 Tweet 和 Facebook 消息，尽管我们在消息中看不到任何实体。但是，程序并不知道这一点。我们将只运行第一条消息来说明该过程的这一步。

我们将首先安装 Hugging Face 变压器：

!pip install -q transformers
from transformers import pipeline
from transformers import AutoTokenizer, AutoModelForSequenceClassification,AutoModel

现在，我们可以运行第一条消息：

nlp_token_class = pipeline('ner')
nlp_token_class('I have had rifles and guns for years and never had a problem. I raised my kids right so they have guns too and never hurt anything except rabbits.')

由于没有实体，因此输出不会产生任何结果。然而，这并不意味着它应该被取出的管道。另一个句子可能包含提供该地区文化线索的人的位置名称。

在继续之前，让我们检查一下我们正在使用的模型：

nlp_token_class.model.config

输出显示该模型使用 9 个标签和 1,024 个特征用于注意力层：

BertConfig {
  "_num_labels": 9,
  "architectures": [
    "BertForTokenClassification"
  ],
  "attention_probs_dropout_prob": 0.1,
  "directionality": "bidi",
  "hidden_act": "gelu",
  "hidden_dropout_prob": 0.1,
  "hidden_size": 1024,
  "id2label": {
    "0": "O",
    "1": "B-MISC",
    "2": "I-MISC",
    "3": "B-PER",
    "4": "I-PER",
    "5": "B-ORG",
    "6": "I-ORG",
    "7": "B-LOC",
    "8": "I-LOC"
  },

我们正在使用BERT 24 层变压器模型。如果您想探索架构，请运行nlp_token_class.model.

我们现在将对消息运行 SRL。

语义角色标签 (SRL)

我们将继续Fake_News.ipynb按照笔记本中的顺序逐个单元运行。我们将检查两个观点。

让我们从支持枪支的角度开始。

Pro-guns SRL

我们将首先在中运行以下单元格Fake_News.ipynb：

!echo '{"sentence": "I have had rifles and guns for years and never had a problem. I raised my kids right so they have guns too and never hurt anything except rabbits."}' | \
allennlp predict https://storage.googleapis.com/allennlp-public-models/bert-base-srl-2020.03.24.tar.gz -

输出非常详细，如果您希望详细调查或解析标签，可能会很有用，如以下摘录所示：

prediction:  {"verbs": [{"verb": "had", "description": "[ARG0: I] have [V: had] [ARG1: rifles and guns] [ARGM-TMP: for years] and never had a problem ...

现在让我们在语义角色标签部分深入了解 AllenNLP 的视觉细节。我们首先为此消息运行 SRL 任务。第一个动词 ,had表明这Afirst78是一个有经验的枪支拥有者：

图 13.6：动词“had”的 SRL

had总结Afirst78经验的论据：I++ 。rifles and gunsfor years

第二had用于添加信息的框架I+ never+ had+a problem

raiseddisplayAfirst78亲子经历的论据：

图 13.7：SRL 动词和动词“raised”的参数

这些论点解释了许多支持枪支的立场：my kids+ …have guns too and never hurt anything。

结果可能每次运行或模型更新时都会有所不同，但过程保持不变。

我们可以通过一些解析将我们在这里找到的内容添加到我们的函数集合中：

Fake_News_FUNCTION_3: I + rifles and guns + for years
Fake_News_FUNCTION_4: my kids+have guns和never hurt anything

现在让我们探索枪支管制信息。

枪支管制 SRL

我们将首先在中运行 Facebook 消息Fake_News.ipynb。我们将继续按照在笔记本中创建的顺序逐个运行笔记本单元：

!echo '{"sentence": "I have heard gunshots all my life in my neighborhood, have lost many friends, and am afraid to go out at night."}' | \
allennlp predict https://storage.googleapis.com/allennlp-public-models/bert-base-srl-2020.03.24.tar.gz -

结果详细标记了序列中的关键动词，如以下摘录所示：

prediction:  {"verbs": [{"verb": "heard", "description": "[ARG0: I] have [V: heard] [ARG1: gunshots all my life in my neighborhood]"

我们继续应用我们的流程，转到 AllenNLP，然后转到语义角色标签部分。我们输入句子并运行转换器模型。动词heard显示了这条信息的严峻现实：

图 13.8：动词“听到”的 SRL 表示

我们可以快速解析第五个函数的单词：

Fake_News_FUNCTION_5: heard + gunshots + all my life

动词lost显示了与之相关的重要论点：

图 13.9：动词“lost”的 SRL 表示

我们有第六个功能所需的东西：

Fake_News_FUNCTION_6: lost + many + friends

很好一旦不同的转换器模型阐明了消息的各个方面，就向用户建议参考站点。

参考网站

我们跑了NLP 任务上的转换器并描述了传统的启发式需要开发硬编码来解析数据并生成六个函数。

请记住，每次运行的结果可能会有所不同。这六个函数是在不同时间生成的，提供的结果与上一节略有不同。但是，主要思想保持不变。现在让我们关注这六个功能。

专业枪：Fake_News_FUNCTION_1: never+ problem+guns
枪支管制：Fake_News_FUNCTION_2: heard+ afraid+guns
专业枪：Fake_News_FUNCTION_3: I+ rifles and guns+for years
专业枪：Fake_News_FUNCTION_4: my kids+ have guns+never hurt anything
枪支管制：Fake_News_FUNCTION_5: heard+ gunshots+all my life
枪支管制：Fake_News_FUNCTION_6: lost+ many+friends

让我们重新组织一下列出并区分两种观点并得出一些结论来决定我们的行动。

专业枪支和枪支管制

支持枪支的论点是诚实的，但是他们表明缺乏关于美国主要城市正在发生的事情的信息：

专业枪：Fake_News_FUNCTION_1: never+ problem+guns
专业枪：Fake_News_FUNCTION_3: I+ rifles and guns+for years
专业枪：Fake_News_FUNCTION_4: my kids+ have guns+never hurt anything

枪支管制的论点是老实说，但他们表明缺乏关于中西部安静区域有多大的信息：

枪支管制：Fake_News_FUNCTION_2: heard+ afraid+guns
枪支管制：Fake_News_FUNCTION_5: heard+ gunshots+all my life
枪支管制：Fake_News_FUNCTION_6: lost+ many+friends

可以开发每个功能来通知对方。

例如，让我们FUNCTION1用伪代码来表达它：

Def FUNCTION1:
call FUNCTIONs 2+5+6 Keywords and simplify
Google search=afraid guns lost many friends gunshots

该过程的目标是：

首先，运行 Transformer 模型来解构和解释消息。使用 NLP 转换器就像一个数学计算器。它可以产生良好的结果，但需要一个自由思考的人类思维来解释它们！
然后，要求训练有素的 NLP 人类用户积极主动地搜索和阅读信息。

Transformer 模型帮助用户更深入地理解消息；他们不为他们考虑！我们正在努力帮助用户，而不是说教或洗脑！

解析将需要处理函数的结果。但是，如果我们有数百条社交媒体消息，我们可以自动让我们的程序完成整个工作。

链接将随着谷歌修改其搜索而改变。然而，第一个出现的链接很有趣，可以向支持枪支的拥护者展示：

图 13.10：枪支和暴力

假设我们正在使用以下伪代码搜索枪支管制倡导者：

Def FUNCTION2:
call FUNCTIONs 1+3+4 Keywords and simplify
Google search=never problem guns for years kids never hurt anything

谷歌搜索没有明显的积极结果有利于支持枪支的拥护者。最多有趣的是中性和教育：

图 13.11：喷枪安全

您可以在亚马逊的书店、杂志和其他教育材料上运行自动搜索。

最重要的是，对于持相反意见的人来说，在不打架的情况下相互交谈是必不可少的。相互理解是培养双方同理心的最佳方式。

人们可能会倾向于信任社交媒体公司。我建议永远不要让第三方充当您思维过程的代理。使用转换器模型来解构消息，但要保持主动！

对此达成共识主题可能是就以下安全准则达成一致拥有枪支。例如，您可以选择在家中不携带枪支或将枪支安全地锁起来，这样孩子们就无法接触到它们。

让我们继续讨论 COVID-19 和前总统特朗普的推文。

COVID-19 和前总统特朗普的推文

无论您的政治观点如何，唐纳德特朗普和关于唐纳德特朗普的言论太多，以至于需要一本书本身来分析所有信息！这是技术，不是政治书，所以我们将科学地分析推文。

我们在本章的枪支管制部分描述了一种针对假新闻的教育方法。我们不需要再经历整个过程。

我们在枪支控制部分的Fake_News.ipynb笔记本中使用 BERT 模型实现并运行了 AllenNLP 的 SRL 任务。

在本节中，我们将重点介绍假新闻的逻辑。我们将在 SRL 上运行 BERT 模型，并在 AllenNLP 的网站上可视化结果。

现在，让我们浏览一些关于 COVID-19 的总统推文。

语义角色标签 (SRL)

SRL 对我们所有人来说都是一个极好的教育工具。我们往往只是被动地阅读推文，听别人说什么说说他们。使用 SRL 分解消息是培养社交媒体分析技能以区分虚假信息和准确信息的好方法。

我建议在课堂上将 SRL 变压器用于教育目的。年轻学生可以输入推文并分析每个动词及其论点。它可以帮助年轻一代成为社交媒体上的活跃读者。

我们将首先分析一条相对未分割的推文，然后分析一条有冲突的推文：

让我们分析一下 7 月 4 日在撰写本书时发现的最新推文。我取出了被称为“美国黑人”的人的名字，并转述了前总统的一些文字：

X is a great American, is hospitalized with coronavirus, and has requested prayer. Would you join me in praying for him today, as well as all those who are suffering from COVID-19?

让我们去 AllenNLP 的Semantic Role Labeling部分，运行句子，看看结果。动词hospitalized表明该成员正在接近事实：

图 13.12：动词“hospitalized”的 SRL 参数

讯息很简单：X++ 。hospitalizedwith coronavirus

动词requested表明该信息正在变得政治化：

图 13.13：动词“requested”的 SRL 参数

我们不知道该人是否要求前总统祈祷或决定他将成为请求的中心。

一个很好的练习是显示一个 HTML 页面并询问用户他们的想法。例如，用户可以要求查看 SRL 任务的结果并回答以下两个问题：

Was former President Trump asked to pray, or did he deviate a request made to others for political reasons?

Is the fact that former President Trump states that he was indirectly asked to pray for X fake news or not?

您可以考虑并自己决定！

让我们看一下被 Twitter 禁止的内容。我把名字拿出来解释一下，然后调低调。尽管如此，当我们在 AllenNLP 上运行它并可视化结果时，我们会得到一些令人惊讶的 SRL 输出。

这是经过淡化和释义的推文：

These thugs are dishonoring the memory of X.

When the looting starts, actions must be taken.

虽然我压制了原始推文的主要部分，但我们可以看到 SRL 任务显示了推文中的不良关联：

图 13.14：动词“dishonoring”的 SRL 参数

对此的一种教育方法是解释我们不应该将论点thugs与memory和联系起来looting。他们根本不适合在一起。

一个重要的练习是询问用户为什么 SRL 参数不适合在一起。

我推荐许多这样的练习，以便变压器模型用户培养 SRL 技能，对呈现给他们的任何主题都有批判性的看法。

批判性思维是阻止假新闻大流行传播的最佳方式！

我们已经通过变形器、启发式方法和指导性网站对假新闻采取了合理的方法。然而，最终，假新闻辩论中的很多热度归结为情绪化和非理性反应。

在舆论的世界里，你永远不会找到一个完全客观的变压器模型来检测假新闻因为对立的双方从一开始就不会就真相达成一致！一侧将同意变压器模型的输出。另一个人会说这个模型是有偏见的，是由他们意见的敌人建立的！

最好的方法是倾听他人的意见并保持冷静！

在我们走之前

本章更多地关注将变压器应用于问题，而不是寻找不存在的灵丹妙药变压器模型。

解决 NLP 问题有两个主要选择：寻找新的变压器模型或创建可靠、耐用的方法来实现变压器模型。

我们现在将结束本章并继续解释变压器模型。

概括

假新闻始于我们作为人类的情感历史深处。当事件发生时，情绪会接管以帮助我们对情况做出快速反应。当我们受到威胁时，我们天生就会做出强烈反应。

假新闻会引起强烈反应。我们担心这个消息可能会暂时或永久地损害我们的生活。我们中的许多人相信气候变化可能会从地球上消灭人类的生命。其他人认为，如果我们对气候变化反应过于强烈，我们可能会破坏我们的经济并破坏社会。我们中的一些人认为枪支很危险。其他人提醒我们，美国宪法第二修正案赋予我们在美国拥有枪支的权利。

我们经历了关于 COVID-19、前总统特朗普和气候变化的其他激烈冲突。在每一种情况下，我们都看到情绪反应是最快形成冲突的反应。

然后，我们设计了一个路线图，将假新闻的情感感知提升到理性水平。我们使用了一些 Transformer NLP 任务来证明可以在推文、Facebook 消息和其他媒体中找到关键信息。

我们利用一些人认为是真实新闻而另一些人认为是假新闻的新闻来为老师、父母、朋友、同事或只是人们说话的理由。我们添加了经典的软件功能来帮助我们。

至此，您拥有了一个包含 Transformer 模型、NLP 任务和示例数据集的工具包。

您可以使用人工智能造福人类。您可以自行决定采用这些变压器工具和想法来实施它们，以使世界变得更美好。

了解 Transformer 的一个好方法是可视化它们的内部过程。我们将在下一章“解释黑盒变压器模型”中分析变压器如何逐渐构建序列的NLP

你可能感兴趣的:(深度学习（DL）,自然语言处理（NLP）,自然语言处理,人工智能)

WGAN - 瓦萨斯坦生成对抗网络池央生成对抗网络人工智能神经网络
1.背景与问题生成对抗网络（GenerativeAdversarialNetworks,GANs）是由IanGoodfellow等人于2014年提出的一种深度学习模型。它包括两个主要部分：生成器（Generator）和判别器（Discriminator），两者通过对抗训练的方式，彼此不断改进，生成器的目标是生成尽可能“真实”的数据，而判别器的目标是区分生成的数据和真实数据。虽然传统GAN在多个领域
【大模型】AutoDL部署AI绘图大模型Stable Diffusion使用详解小码农叔叔 AI大模型实战与应用 AutoDL部署AI绘图大模型 AI绘图大模型 AutoDL部署SD AI绘图大模型SD使用详解 SD使用详解 SD部署
目录一、前言二、AI绘图大模型概述2.1AI绘图大模型介绍2.2AI绘图大模型特点2.3AI绘图大模型优势三、主流的AI绘图大模型介绍3.1Midjourney3.1.1Midjourney介绍3.1.2Midjourney功能特点3.1.3Midjourney使用场景3.2StableDiffusion3.2.1StableDiffusion介绍3.2.2StableDiffusion特点3.2
【Lora微调】提高模型效率的创新方法 @fishv 人工智能大模型微调 Lora
前言在自然语言处理（NLP）和机器学习的研究和应用中，随着模型规模的不断扩大，模型训练的计算成本和存储需求也不断攀升。大型预训练模型，如GPT、BERT等，虽然在许多任务上表现出色，但它们的训练和微调通常需要巨大的计算资源，这使得许多研究者和开发者无法充分利用这些模型进行个性化或领域特定的调整。为了在保持模型性能的同时减少计算开销，**Lora（Low-RankAdaptation）**应运而生。
InternLM: LMDeploy 量化部署进阶实践 dilvx 机器学习
LMDeploy部署模型模型部署是将训练好的深度学习模型在特定环境中运行。欢迎使用LMDeploy，支持市面上主流的格式和算法。大模型缓存推理本章的前半部分主要讲量化，包括KV-Cache量化、权重量化、激活值量化。量化主要是为了节省存储空间，用int4,int8来重新表示fp16，将模型的显存占用控制在200G可接受的范围下。值得注意的是，在transformer架构下，计算的瓶颈主要在显存带宽
线性回归——最小二乘法代数详细计算过程在天愿作比翼鸟在地愿为连理枝机器学习和人工智能学习概述线性回归最小二乘法机器学习
Reference:动手实战人工智能AIByDoing关于矩阵方法的求解可参考：最小二乘法矩阵详细计算过程基本定义：通过找到一条直线去拟合数据点的分布趋势的过程，就是线性回归的过程。在上图呈现的这个过程中，通过找到一条直线去拟合数据点的分布趋势的过程，就是线性回归的过程。而线性回归中的「线性」代指线性关系，也就是图中所绘制的红色直线。所以，找到最适合的那一条红色直线，就成为了线性回归中需要解决的目
《数据孤岛：AI模型训练之殇，精度与泛化的双重困境》人工智能深度学习
在人工智能飞速发展的当下，数据就是模型的“燃料”。从医疗影像诊断到智能交通调度，从电商推荐系统到金融风险预测，AI模型的精准度与泛化能力，决定了其在实际应用中的价值。然而，一个棘手的问题正阻碍着AI前行的步伐——数据孤岛。数据孤岛，是指在组织内部或不同组织之间，由于系统、管理或流程的原因，数据被孤立存储在不同的数据库、应用程序或部门中，彼此之间缺乏有效的连接和整合。据权威机构调研，在高度信息化的企
再分享API形式调用Dify项目应用福安德信息科技大模型 python 人工智能大模型 llm dify
大模型相关目录大模型，包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容从0起步，扬帆起航。RAGOnMedicalKG：大模型结合知识图谱的RAG实现DSPy：变革式大模型应用开发最简明的Few-shotPrompt指南SemanticKernel：微软大模型开发框架——LangChain替代对话大模型Prompt是否需要
NVIDIA-TensorRT-Python推理呆呆珝推理框架 python 人工智能开发语言
1,前言NVIDIATensorRT进行模型推理的Python实现。TensorRT是一个高性能的深度学习推理优化器和运行时，它能够为深度学习模型提供低延迟和高吞吐量的推理能力。(由于官方文档的使用还是比较简单，也可能自己很菜，参考了别人的文档和自己摸索，写出来这个可以使用的API)2.Python-API推理step1：导入基本库(环境自行配置)#导入TensorRT库importtensorr
NCNN推理呆呆珝推理框架 c++人工智能
1.前言ncnn是一个高性能的神经网络前向计算框架，专门针对移动设备和嵌入式设备设计。它由腾讯优图实验室开发，旨在提供高效的神经网络推理能力，特别是在资源受限的环境中，如智能手机和嵌入式系统。ncnn被广泛应用于移动端和嵌入式设备上的各种深度学习应用，包括但不限于：图像分类/目标检测/语义分割/人脸识别/图像生成与处理2.NCNN的CMakeLists.txt编写ncnn的头文件，链接文件，静态链
基于深度学习的鸟类识别系统详解（UI界面 + YOLOv10 + 数据集） 2025年数学建模美赛深度学习 ui YOLO 人工智能 python 计算机视觉
引言鸟类识别是计算机视觉领域中一个独具挑战性的任务，尤其是在复杂的自然环境中，识别不同种类的鸟类需要非常强大的模型和丰富的数据集。随着深度学习技术的发展，基于YOLO（YouOnlyLookOnce）系列模型的目标检测系统展现了卓越的性能，特别是在速度和精度上的平衡方面。本博客将详细讲解如何利用YOLOv10模型来构建一个基于深度学习的鸟类识别系统。该系统会结合自定义鸟类数据集，设计一个简洁直观的
自动驾驶系统研发系列—追尾风险不再隐形：解密后碰撞预警系统（RCW）的技术与应用学步_技术自动驾驶系统研发自动驾驶人工智能机器学习 RCW
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
算法：数据结构与算法（总结）鲲鹏飞九万里算法算法数据结构 java
数据结构与算法文章目录数据结构与算法一、数据结构1.1BST、AVL、Red-BlackBST1.2Trie字典树、LRUCache、布隆过滤器1.3Union-find并查集1.4数组ArrayList、链表LinkedList、跳表SkipList跳表[Skiplist](https://gitee.com/lf-ren/java-re-new-builder/blob/master/proj
【Mysql】Mysql数据库基本操作-------DDL（中）爱学习的小何同学！数据库 mysql
1、对表结构的常用操作----创建表创建表格式：creattable(ifnotexists)(可以省略）表名(字段一类型[（宽度）][约束条件][comment'字段说明'],字段二类型[（宽度）][约束条件][comment'字段说明'],...)(表的一些设置）;创建表是构建一张空表，指定这个表的名字，这个表有几列，每一列叫什么名字，以及每一列存储的数据类型。示例：2、数据类型数据类型是指在
自动驾驶系列—自动驾驶MCU架构全方位解析：从单核到多核的选型指南与应用实例学步_技术自动驾驶自动驾驶单片机架构 MCU
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
你知道吗？其实这些都是AI——智能聊天机器人贫苦游商人工智能机器人机器学习 AIGC 制造
智能聊天机器人AI：优化用户体验的智能助手在现代的数字化生活中，智能聊天机器人已经成为许多中国社交平台上不可或缺的一部分。这些机器人通过人工智能技术的支持，为用户提供各种互动服务，从回答常见问题到提供个性化建议，极大地提升了用户体验和平台的服务质量。智能聊天机器人AI的核心在于其强大的自然语言处理能力。通过分析用户的输入文本，这些系统能够理解用户的意图，并生成相应的回复。例如，当用户在购物平台上询
视频修复最强算法部署笔记2025 AI算法网奇深度学习宝典 aigc与数字人笔记深度学习
目录模型下载：模型：原版保存的视频，vscode不播放：模型下载：ReleaseProPainterV0.1.0Release·sczhou/ProPainter·GitHubhuggingface-clidownload--resume-downloadlixiaowen/diffuEraser--local-dir/mnt/pfs/models/huggingface/models--lixi
分享当下最热门的AI工具合集香橙薄荷心人工智能人工智能
1、ChatGPTChatGPT一个基于人工智能技术的虚拟助手，旨在为用户提供信息、解答问题和协助完成各种任务。我能够处理多种主题，包括但不限于科学、技术、文化、历史等领域。我的目标是为您提供准确、及时的帮助，以提升您的工作和生活效率这个，可免费使用GPT-3.5和GPT-4.0模型~推荐指数：⭐⭐⭐⭐⭐链接：点击直达>>>2、ChatGAIChatGAI是一个基于人工智能技术的语言模型，旨在理解
56.命令绑定 C#例子 WPF例子军训猫猫头 c#wpf 开发语言
一共是两个控件，绑定了属性和命令。用的是最简做法创建依赖：publicclassRelayCommand:ICommand{privatereadonlyAction_execute;publiceventEventHandlerCanExecuteChanged;publicRelayCommand(Actionexecute)=>_execute=execute;publicboolCanEx
【skynet源码阅读系列】03_skynet_context_new 程序员杨小哥 skynet
上一节看了skynet_start()的一部分代码，那部分代码主要做了下面几件事。如果当前进程收到SIGHUP信号，则调用handle_hup函数，将SIG设为1检查配置文件内的deamon配置，这个配置对应一个文件路径，文件内的记录进程的pid号，防止重复启动skynet进程，第一次启动将自动将进程号写入文件。重定向了文件描述符，把文件描述符0，1，2重定向到了/dev/null，相当于当前进程
Greenplum基础 Aimyon_36 PostgreSql postgresql 数据库
Greenplum基础MPP架构一、Greenplum架构1.1Master/Coordinator节点1.2Segment节点1.3Interconnect二、Greenplum基本使用2.1登录2.2数据类型2.2.1枚举类型2.2.2几何类型2.2.3网络地址类型2.2.4JSON类型2.2.5数组类型2.2.6复合类型三、DDL（DataDefinitionLanguage）数据定义语言3
华为OD机试E卷 - 增强的strstr（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 java 华为od python javascript c语言 c++华为OD机试E卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述C语言有一个库函数：char*strstr(constchar*haystack,constchar*needle)，实现在字符串haystack中查找第一次出现字符串needle的位置，如果未找到则返回null。现要求实现一个strstr的增强函数，可以使用带可选段的字符串来模糊查询，与strstr一样返回首次查找到
Python爬取搜索引擎结果数目 Gaia_Pygmalion python
#coding:utf-8importurllibimporturllib2importreimportsysimportsocketimporttimeprint"Startofwork"filename="keywords.txt"#关键词文件fid=open(filename,'r')all_text=fid.readlines()NumOutput=open(r'searchnumber.
华为OD机试E卷 --增强的strstr--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码题目描述C语言有一个库函数:char*strstr(constchar*haystack,constchar*needle),实现在字符串haystack中查找第一次出现字符串needle的位置，如果未找到则返回null。现要求实现一个strstr的增强函数，可以使用带可选段的字符串来模糊查询，strstr
安卓动态设置Unity图形API Jack Yan Unity进阶 android unity 游戏引擎
命令行方式Unity图像api设置为自动，安卓动态设置Vulkan、OpenGLESUnity设置安卓设置创建自定义活动并将其设置为应用程序入口点。在自定义活动中，覆盖字符串UnityPlayerActivity。updateunitycommandlineararguments（StringcmdLine）方法。在该方法中，将cmdLine参数与您自己的启动参数连接起来，然后返回结果。重要：cm
Transformer大模型实战 BART模型的架构 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer大模型实战BART模型的架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming/TextGenWebUILLMTransformer大模型实战BART模型的架构1.背景介绍1.1问题的由来随着大规模预训练模型的兴起，如BERT、GPT系列等，研究人员发现基于Transformer架构的模型在自然语言处理任务上表现出了显著的优势。为
kotlin gradle踩过的坑 112479 随手记 kotlin 开发语言 android
Nocachedversionofcom.android.tools.build:gradle3.6.1availableforofflinemode解决方法-CSDN博客配置文件里的gradle版本，需要和gradle环境版本一致Gradle入门初探_gradle环境变量配置-CSDN博客java历史版本，附账号密码JDK历史所有版本下载地址（附Oracle帐号）_能下载任何版本jdk的软件-C
【Android】【UI】Progress rotate animate 用户昵称2021 Android app android ui kotlin
方法一：在drawable目录下创建loading_progress.xml在布局文件中添加如下：方法二：overridefunonViewCreated(view:View,savedInstanceState:Bundle?){super.onViewCreated(view,savedInstanceState)varrotateAnimation=AnimationUtils.loadAn
麦田物语学习笔记:创建DragItem实现物品的拖拽跟随显示扶离_flee 麦田物语学札学习笔记
基本流程1.代码思路(1)在SlotUI中使用拖拽接口IBeginDragHandler,IDragHandler,IEndDragHandler(2)开始拖拽的时候,在屏幕上生成物体,拖拽期间物体显示为当前被拖拽的物体的图标,停止拖拽时图标消失(3)基于以上,所以我们要获得这个图标的控制,则要去InventoryUI里获得(4)在停止拖拽的时候检测该位置所对应的GameObject,值得注意的是
信息学/计算机系各种网站（学习资源、常用工具及其他）一只贴代码君命令大全-干货合集学习 dubbo java 开发语言算法 c++
大学指南上海交通大学生存手册中国科学技术大学人工智能与数据科学学院本科进阶指南USTC不完全入学指南大学生活质量指北科研论信息搜集AI信息搜集USTC飞跃网站计算机保研技术新闻HackerNewsTheHackerNewsTechCrunchArsTechnicaMITNews技术博客日更技术雷达学习资源CS清华计算机系学生科协技能引导文档菜鸟教程北大CS自学指南OpenSourceSociety
2024年人工智能领域发生了哪些事儿？全球AI大事件1至12月盘点人工智能aigc
2024年，对人工智能（AI）而言是激动人心的一年。这一年不仅见证了AI技术的全面突破，也深刻改变了社会生活的方方面面。从金融到医疗、从教育到娱乐，AI的深度渗透无处不在。显然，这项技术已经从概念走向普及，并开始重新定义我们的未来。一月：人机交互技术的崭新开端2024年1月30日：Neuralink脑机接口植入Neuralink宣布，首名人类成功接受脑机接口芯片植入手术。这项手术由机器人完成，芯片
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

【NLP】第13章 用Transformers分析假新闻

foreword

对假新闻的情绪反应

认知失调引发情绪反应

分析有冲突的推文

假新闻的行为表征

对假新闻的理性处理

定义假新闻解决路线图

枪支管制辩论

情绪分析

命名实体识别 (NER)

语义角色标签 (SRL)

枪支管制 SRL

参考网站

COVID-19 和前总统特朗普的推文

语义角色标签 (SRL)

在我们走之前

概括

你可能感兴趣的:(深度学习（DL）,自然语言处理（NLP）,自然语言处理,人工智能)

【NLP】第13章用Transformers分析假新闻