数据派THU

独家 | 基于NLP的COVID-19虚假新闻检测（附代码）

作者：Susan Li

翻译：杨毅远

校对：吴金笛

本文长度为4400字，建议阅读8分钟

本文为大家介绍了基于自然语言处理的COVID-19虚假新闻检测方法以及可视化方法，并结合真实的新闻数据集与完整的代码复现了检测以及可视化的过程。

标签：自然语言处理数据可视化

最近有这样一则新闻：一半的加拿大人被COVID-19的阴谋论所愚弄，这个新闻真的令人心碎。

世界卫生组织（WHO）称，与COVID-19相关的信息流行病与病毒本身同样危险。同样地，阴谋论、神话和夸大的事实可能会产生超出公共健康范围的后果。

多亏了Lead Stories，Poynter，FactCheck.org，Snopes，EuVsDisinfo等项目可以监视、识别和检查散布在世界各地的虚假信息。

为了探究COVID-19虚假新闻的内容，我对于真实新闻和虚假新闻进行了严格的定义。具体来说，真实新闻是众所周知的真实报道并且来自可信赖的新闻机构；虚假新闻是众所周知的错误报道并且来自知名的有意试图散布错误信息的虚假新闻网站。

基于以上定义，我从各种新闻资源中收集了1100篇有关COVID-19的新闻文章和社交网络帖子并对其进行了标记。

数据集可以在这里找到：

https://raw.githubusercontent.com/susanli2016/NLP-with-Python/master/data/corona_fake.csv

数据

1. from nltk.corpus import stopwords  
2. STOPWORDS = set(stopwords.words('english'))  
3. from sklearn.feature_extraction.text import CountVectorizer  
4.   
5. from textblob import TextBlob  
6. import plotly.express as px  
7. import plotly.figure_factory as ff  
8. import plotly.graph_objects as go  
9.   
10. df = pd.read_csv('data/corona_fake.csv')  
11. df.loc[df['label'] == 'Fake', ['label']] = 'FAKE'  
12. df.loc[df['label'] == 'fake', ['label']] = 'FAKE'  
13. df.loc[df['source'] == 'facebook', ['source']] = 'Facebook'  
14.   
15. df.loc[5]['label'] = 'FAKE'  
16. df.loc[15]['label'] = 'TRUE'  
17. df.loc[43]['label'] = 'FAKE'  
18. df.loc[131]['label'] = 'TRUE'  
19. df.loc[242]['label'] = 'FAKE'  
20.   
21. df = df.sample(frac=1).reset_index(drop=True)  
22. df.label.value_counts()

process_data.py

经过数据清洗，我们可以看到共有586篇真实新闻和578篇虚假新闻。

df.loc[df['label'] == 'TRUE'].source.value_counts()

图一

真实新闻主要来自哈佛健康出版社(Harvard Health Publishing)、《纽约时报》(The New York Times)、约翰霍普金斯大学彭博公共卫生学院(Johns Hopkins Bloomberg School of Public Health)、世卫组织(WHO)以及疾病预防控制中心(CDC)等机构。

df.loc[df['label'] == 'FAKE'].source.value_counts()

图二

其中的几个虚假新闻是从Facebook的帖子中收集的，其是一个名为Natural News的极右网站和一个名为orthomolecular.org的替代医学网站。一些文章或帖子已从互联网或社交网络中删除，但是，他们仍能够在网络中被查询到。

使用下面的函数，我们将能够阅读任何给定的新闻内容并由此确定如何清洗它们：

1. def print_plot(index):  
2.     example = df[df.index == index][['text','label']].values[0]  
3.     if len(example) > 0:  
4.         print(example[0])  
5.         print('label:', example[1])  
6.           
7. print_plot(500)

print_plot.py

print_plot(1000)

由于我们数据集中文章内容很清晰，所以我们仅需要删除标点符号并将大写字母改为小写即可。

1. df['text'] = df['text'].str.replace('[^\w\s]','')  
2. df['text'] = df['text'].str.lower()

文章长度

在接下来的步骤中：

获取每篇新闻的情感得分，而且分数控制在[-1,1]范围内，其中1表示积极情绪，-1表示消极情绪。
获取每篇文章的长度（字数）。

df['polarity'] = df['text'].map(lambda text: TextBlob(text).sentiment.polarity)  
   
def text_len(x):  
    if type(x) is str:  
             return len(x.split())  
    else:  
        return 0  
   
df['text_len'] = df['text'].apply(text_len)  
nums_text = df.query('text_len > 0')['text_len']  
   
fig = ff.create_distplot(hist_data = [nums_text], group_labels = ['Text'])  
fig.update_layout(title_text='Distribution of article length', template="plotly_white")  
fig.show()

polarity_length.py

图三

数据集中的大多数文章少于1000个单词。不过，有少数文章超过4000个单词。

当我们按标签区分时，就文章的长度而言，真实新闻和虚假新闻之间没有明显的区别，尽管在数据集中大多数真实新闻似乎都比虚假新闻短一些。

1. fig = px.histogram(df, x="text_len", y="text", color="label",  
2.                    marginal="box",  
3.                    hover_data=df.columns, nbins=100)  
4. fig.update_layout(title_text='Distribution of article length', template="plotly_white")  
5. fig.show()  
text_len_hist.py

图四

为了显示不同新闻的文本长度的概率密度，我们使用小提琴图(violin plot)表示：

1. fig = px.violin(df, y='text_len', color='label',  
2.                 violinmode='overlay',   
3.                 hover_data=df.columns, template='plotly_white')  
4. fig.show()

text_len_violin.py

图五

Facebook vs. Harvard

平均而言，Facebook的帖子比哈佛健康的文章短得多：

1. df_new = df.loc[(df['source'] == 'Facebook') | (df['source'] == 'https://www.health.harvard.edu/')]  
2.   
3. fig = px.histogram(df_new, x="text_len", y="text", color='source',  
4.                    marginal="box",  
5.                    hover_data=df_new.columns, nbins=100)  
6. fig.update_layout(title_text='Distribution of article length of two sources', template="plotly_white")  
7. fig.show()

facebook_harvard_textlen_hist.py

图六

我们也可以使用小提琴图(violin plot)来呈现：

1. fig = px.violin(df_new, y='text_len', color='source',  
2.                 violinmode='overlay',   
3.                 hover_data=df_new.columns, template='plotly_white')  
4. fig.show()

facebook_harvard_textlen_violin.py

图七

也许我们大家都很熟悉，Facebook虚假帖子的内容往往更短。发表文章的人试图通过试探法而非说服力来说服读者。

情感极性

1. x1 = df.loc[df['label']=='TRUE']['polarity']  
2. x2 = df.loc[df['label'] == 'FAKE']['polarity']  
3.   
4. group_labels = ['TRUE', 'FAKE']  
5.   
6. colors = ['rgb(0, 0, 100)', 'rgb(0, 200, 200)']  
7.   
8. fig = ff.create_distplot(  
9.     [x1, x2], group_labels,colors=colors)  
10.   
11. fig.update_layout(title_text='polarity', template="plotly_white")  
12. fig.show()

label_polarity.py

图八

真实新闻与虚假新闻在情感方面没有明显差异，我们可以使用小提琴图(violin plot)来证实：

1. fig = p.violin(df, y='polarity', color="label",  
2.                 violinmode='overlay',  
3.                 template='plotly_white')  
4. fig.show()

polarity_violin.py

图九

当我们比较这四个来源之间的情绪极性时，我们可以看到《纽约时报》和《自然新闻》的情绪分布比哈佛健康新闻和Facebook的情绪分布要窄得多。

1. x1 = df.loc[df['source']=='Facebook']['polarity']  
2. x2 = df.loc[df['source'] == 'https://www.health.harvard.edu/']['polarity']  
3. x3 = df.loc[df['source'] == 'https://www.nytimes.com/']['polarity']  
4. x4 = df.loc[df['source'] == 'https://www.naturalnews.com/']['polarity']  
5. group_labels = ['Facebook', 'Harvard', 'nytimes', 'naturalnews']  
6.   
7. colors = ['rgb(0, 0, 100)', 'rgb(0, 200, 200)', 'rgb(100, 0, 0)', 'rgb(200, 0, 200)']  
8.   
9. # Create distplot with custom bin_size  10. fig = ff.create_distplot(  
11.     [x1, x2, x3, x4], group_labels,colors=colors)  
12.   
13. fig.update_layout(title_text='polarity', template="plotly_white")  
14. fig.show()

polarity_source.py

图十

这意味着《纽约时报》的新闻和数据中的自然新闻听起来不那么具有情绪。

可以用以下小提琴图(violin plot)来证实：

1. fig = go.Figure()  
2.   
3. sources = ['https://www.health.harvard.edu/', 'https://www.nytimes.com/', 'Facebook', 'https://www.naturalnews.com/']  
4.   
5. for source in sources:  
6.     fig.add_trace(go.Violin(x=df['source'][df['source'] == source],  
7.                             y=df['polarity'][df['source'] == source],  
8.                             name=source,  
9.                             box_visible=True,  
10.                             meanline_visible=True))  
11. fig.update_layout(title_text='Polarity of four sources', template='plotly_white')  
12. fig.show()

source_violin.py

图十一

情绪vs文章长度vs真实性

我注意到我收集的新闻和帖子既不是非常积极，也不是非常消极。它们大多数处于适度的正数范围内，并且大多数长度少于1000个字。

1. fig = px.density_contour(df, x='polarity', y='text_len', marginal_x='histogram', marginal_y='histogram', template='plotly_white')  
2. fig.update_layout(title_text='Sentiment vs. Article length')  
3. fig.show()

len_polarity.py

图十二

情感与文章的长度之间没有明显的关系。通常，文章的情感或篇幅不能反映其真实性。虚假新闻与真实新闻之间的区别可能是相当随意的。

1. fig = px.scatter(df, x='polarity', y='text_len', color='label', template="plotly_white")  
2. fig.update_layout(title_text='Sentiment polarity')  
3. fig.show()

polarity_scatter.py

图十三

df.groupby(['source']).mean().sort_values('polarity', ascending=False)

图十四

我注意到鲁迪·朱利安妮（Rudy Giuliani）的帖子是情感评分最高的帖子之一，所以我很好奇想知道这篇帖子是关于什么的：

df.loc[df['source'] == 'RudyGiuliani']['text'][880]

当然是关于羟氯喹(Hydroxychloroquine)的啦~。

真实与虚假新闻的内容

现在，我们将了解数据集中包含哪些主题：

1. common_bigram_true = get_top_n_bigram(df.loc[df['label'] == 'TRUE']['text'], 20)  
2. for word, freq in common_bigram_true:  
3.     print(word, freq)

true_bigram.py

1. common_bigram_fake = get_top_n_bigram(df.loc[df['label'] == 'FAKE']['text'], 20)  
2. for word, freq in common_bigram_fake:  
3.     print(word, freq)

fake_bigram.py

促进治愈：这包括使用大剂量静脉注射维生素C。
关于起源的推测：这个主题包括声称冠状病毒是在用于生物武器的实验室中制造的，或者是5G技术导致了这种疾病。
关于有影响力人士的谣言：例如比尔·盖茨和福西博士代表制药公司策划了冠状病毒。
应对人们的恐惧：例如梅林达·盖茨基金会和约翰·霍普金斯大学在三个月前通过Event 201预测了冠状病毒。

从我们的数据来看，真实和虚假新闻内容之间的一个明显区别是，虚假新闻似乎更多地使用了人的名字，这表明虚假新闻可能更加个性化。

naturalnews.com vs orthomolecular.org

以上两个新闻来源都提倡阴谋论，但是它们却关注不同的主题。

1. naturalnews_bigram = get_top_n_bigram(df.loc[df['source'] == 'https://www.naturalnews.com/']['text'], 20)  
2. for word, freq in naturalnews_bigram:  
3.     print(word, freq)

natural_bigram.py

naturalnews.com一直在传播虚假信息，例如在中国实验室将冠状病毒设计为生物武器，并且/或者传播病毒来掩盖暴露于5G无线技术有关有害健康的影响。

1. ortho_bigram = get_top_n_bigram(df.loc[df['source'] == 'http://orthomolecular.org/']['text'], 20)  
2. for word, freq in ortho_bigram:  
3.     print(word, freq)

ortho_bigram.py

orthomolecular.org一直在推广使用大剂量静脉注射维生素C作为治疗方法，但尚无根据。

根据以上分析，大家可以随时自行判断其他新闻的真实性。

总结

首先，我们不知道在收集数据时是否存在选择偏差。其次，虽然以上的新闻都是用户参与度很高的新闻，但我们无法说出这些新闻报导产生的实际流量。尽管有这些不足，但此数据集提供了合理的标签，并且我们知道其内的所有新闻都已被广泛阅读和分享。

原文标题：

Explore COVID-19 Infodemic

原文链接：

https://towardsdatascience.com/explore-covid-19-infodemic-2d1ceaae2306

编辑：王菁

校对：杨学俊

译者简介

杨毅远，清华大学自动化系研一在读，本科毕业于华中科技大学自动化学院实验班，研究方向为工业过程检测中的AI算法。喜欢唱歌、喜欢接触新鲜事物的我对于“AI+”格外感兴趣；入门CV和数据挖掘的我，希望接触到更多非自己研究领域内的事物，拓宽自己的知识圈。

翻译组招募信息

工作内容：需要一颗细致的心，将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生，或在海外从事相关工作，或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到：定期的翻译培训提高志愿者的翻译水平，提高对于数据科学前沿的认知，海外的朋友可以和国内技术应用发展保持联系，THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利：来自于名企的数据科学工作者，北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载，请在开篇显著位置注明作者和出处（转自：数据派ID：DatapiTHU），并在文章结尾放置数据派醒目二维码。有原创标识文章，请发送【文章名称-待授权公众号名称及ID】至联系邮箱，申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱（见下方）。未经许可的转载以及改编者，我们将依法追究其法律责任。

点击“阅读原文”拥抱组织

**LLM Gateway：您的智能对话门户** 芮奕滢Kirby
LLMGateway：您的智能对话门户llm-gatewayGatewayforsecure&reliablecommunicationswithOpenAIandotherLLMproviders项目地址:https://gitcode.com/gh_mirrors/ll/llm-gateway在人工智能和自然语言处理的浪潮中，LLMGateway以其卓越的设计与功能脱颖而出，为开发者和用户提供
python 中serial.read用法详解之serial.read(inwaiting or 1) huiyuanzhenduo python
在Python中，serial.read(inwaitingor1)是pyserial库中用于从串口读取数据的代码片段，下面是详细解释：read()serial类的方法，用于从串口缓冲区读取指定数量的字节数据。格式为read(size)，size为读取的字节数。inwaiting是serial类的属性，返回串口输入缓冲区中等待读取的字节数。如ser.inwaiting()可获取当前缓冲区字节数。i
Qwen-VL论文解读 dream_home8407 人工智能
Qwen-VL：用于理解、定位、文本阅读等的通用视觉-语言模型摘要在本文中，我们介绍了Qwen-VL系列，这是一组大规模的视觉-语言模型（LVLMs），旨在感知和理解文本和图像。从Qwen-LM开始，我们通过精心设计的（i）视觉受体，（ii）输入-输出接口，（iii）3阶段训练管道，以及（iv）多语言多模态清洗语料库，赋予其视觉能力。除了传统的图像描述和问答，我们还通过图像-标题-框元组的对齐实现
探秘 TCP TLP：从背景到实现 dog250 tcp/ip 网络网络协议
回家的路上还讨论了个关于TCPTLP的问题，闲着无事缕一缕。本文内容参考自TailLossProbe(TLP):AnAlgorithmforFastRecoveryofTailLosses以及Linux内核源码。TLP，先说缘由。自TCP引入Fastretrans机制就是为了尽力避免RTO，但如果sender发送的一系列数据包中尾包被丢弃，就没有触发dupack，sack的可能，于是就有了TLP，
通达信实时行情API的功能有哪些？如何利用这些功能进行股票分析股票程序化交易接口量化交易股票API接口 Python股票量化交易通达信实时行情api 股票分析行情数据股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>行情数据获取功能通达信实时行情API能够提供全面的行情数据。它可以获取股票的基本信息，如股票代码、名称等。能精确提供股票的实时价格，包括当前价、开盘价、收盘价等重要价格数据。这些数据是进行股票分析的基础。投资者可以根据当前价与开盘价的
「iOS」通过CoreLocation Framework深入了解MVC架构小鹿撞出了脑震荡 ios mvc 架构
「iOS」通过CoreLocationFramework重新了解多界面传值以及MVC架构文章目录「iOS」通过CoreLocationFramework重新了解多界面传值以及MVC架构前言CoreLocation了解根据需求建模设计属性方法设计协议传值Block传值KVONotification通知方式总结参考文章前言在这个学期的前段时间进行了MVC的相关学习，并且使用MVC完成了知乎日报奥的项目
Python项目之Pygame制作新年烟花！ WANGWUSAN66 pygame python 开发语言计算机经验分享源码
实现源码涉及到两个Python库：random和pygame。1.random库：randint(a,b)：返回一个在[a,b]范围内的随机整数。uniform(a,b)：返回一个在[a,b]范围内的随机浮点数。choice(sequence)：从给定的序列中随机选择一个元素。2.Pygame是一个用于制作游戏的Python模块，它包含了许多用于游戏开发和图形渲染的功能。以下是Pygame的一些主
python爬虫框架Scrapy简介码农~明哥 python python 爬虫 scrapy
当你写了很多个爬虫程序之后，你会发现每次写爬虫程序时，都需要将页面获取、页面解析、爬虫调度、异常处理、反爬应对这些代码从头至尾实现一遍，这里面有很多工作其实都是简单乏味的重复劳动。那么，有没有什么办法可以提升我们编写爬虫代码的效率呢？答案是肯定的，那就是利用爬虫框架，而在所有的爬虫框架中，Scrapy应该是最流行、最强大的框架。Scrapy概述Scrapy是基于Python的一个非常流行的网络爬虫
SpringBoot之远程调用的三大方式码农~明哥网络 websocket
为什么要使用远程调用？SpringBoot不仅继承了Spring框架原有的优秀特性，而且还通过简化配置来进一步简化了Spring应用的整个搭建和开发过程。在Spring-Boot项目开发中，存在着本模块的代码需要访问外面模块接口，或外部url链接的需求,比如在apaas开发过程中需要封装接口在接口中调用apaas提供的接口（像发起流程接口submit等等）下面也是提供了三种方式（不使用dubbo的
DFS+剪枝去重+排序+回溯算法+DFS遍历叶子节点 47. 全排列 II 豌豆射手GCC leetcode DFS
47.全排列II给定一个可包含重复数字的序列，返回所有不重复的全排列。示例:输入:[1,1,2]输出:[[1,1,2],[1,2,1],[2,1,1]]来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/permutations-ii著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。解题难点：数组中有相同元素，但输出的全排列数组不
回溯注意点：回溯时间复杂度的计算与剪枝操作大磕学家ZYX 算法模板与专题整理剪枝算法 c++leetcode
文章目录回溯的时间复杂度计算示例1：77.组合示例2：216.组合总和Ⅲ示例3：17.电话号码字母组合关于剪枝对时间复杂度的影响总结回溯的剪枝操作必要性及适用场景示例1：组合剪枝剪枝优化点：示例2：组合剪枝剪枝优化点：示例3：不能剪枝的情况回溯的时间复杂度计算计算回溯时间复杂度，我们可以使用如下公式：答案个数（叶子节点个数）×路径长度（搜索深度）示例1：77.组合voidbacktracking(
Linux安全体系学习笔记之二：OpenSSL源代码分析(1) Aegeaner 安全 Linux安全体系学习笔记代码分析 linux ssl session callback extension
OpenSSL的源代码包括三部分：加密算法库、SSL库和应用程序。加密算法库的源代码主要在crypto文件夹里，包括ASN.1编码与解码接口（crypto/asn1/asn1.h），伪随机数产生器（crypto/rand/rand.h），ENGINE机制（crypto/engine），统一密码算法的EVP密码算法接口（crypto/evp/evp.h），大数运算接口（crypto/bn/bn.h）
数据备份专家：Drive SnapShot高效备份恢复工具 KJ-拾荒者数据库运维职场和发展性能优化经验分享
你是否在工作中遇到过这样的困扰：系统崩溃或硬盘故障导致重要数据丢失，影响工作效率和项目进度？或者在个人生活中，想要备份重要文件和系统设置，但现有的备份工具操作复杂、效率低下？今天，我要向大家推荐一款能够解决这些问题的高效备份恢复工具——DriveSnapShot！文末有分享链接，一键就能开启高效生活！什么是DriveSnapShot？DriveSnapShot是一款由德国开发者TomEhlert开
如何在亚马逊上避免账户关联风险？全面解析与实用策略跨境猫小妹大数据
亚马逊账户关联问题无疑是卖家们心中的一块大石头，一旦触发关联风险，不仅可能影响流量和销量，还可能导致账户被冻结甚至封号。那么，如何有效规避这些风险，确保业务的稳定和安全呢？本文将从关联的原理出发，为您提供全方位的防关联操作流程解析。亚马逊关联风险：是什么，为什么重要？亚马逊规定，一个卖家原则上只能拥有一个账户，除非获得官方批准的多账户权限。关联风险，简而言之，就是亚马逊通过技术手段识别出多个账户属
flutter面试题及答案，Android架构师必备框架技能核心笔记 2401_84415652 程序员 flutter android 笔记
常规电话面试1JAVA基础思想:设计模式与面向对象2安卓View绘制流程3常规的组件问题4事件分发机制5多线程和安全问题6安卓性能优化和兼容问题:性能优化回答具体面试1线程池原理2线程安全有多少种实现方式3图片加载框架原理4Http协议原理5Okhttp原理6各种内存优化7垃圾回收机制原理8谈谈对同步请求和异步请求的理解9怎么保证同步和异步10Intentservise，底层原理实现11Handl
【算法】经典博弈论问题——斐波那契博弈 + Zeckendorf 定理 python 查理零世算法 python 数据结构
目录斐波那契博弈（FibonacciNim）齐肯多夫（Zeckendorf）定理示例分析实战演练斐波那契博弈（FibonacciNim）先说结论：当初始石子数目n是斐波那契数时，先手必败；否则，先手有策略获胜。证明概要:当n=2时，先手只能取1颗石子，后手直接取剩下的1颗石子获胜，因此先手必败。假设对于所有小于等于某个斐波那契数f[k]的情况，结论都成立。归纳：对于f[k+1]=f[k]+f[k-
单目测距（yolo-目标检测+标定+深度学习目标检测_测距）计算机C9硕士_算法工程师 YOLO 目标检测深度学习
YOLOv5模型介绍YOLOv5是目前最先进的目标检测算法之一，在多个数据集上取得了优秀的表现。相较于YOLOv4，YOLOv5采用了更深的Backbone网络和更高的分辨率输入图像，以提高检测精度和速度。单目测距实现方法在目标检测的基础上，我们可以通过计算物体在图像中的像素大小来估计其距离。具体方法是，首先确定某个物体的实际尺寸，然后根据该物体在图像中的像素大小计算其距离。这个方法可以应用于各种
用 Python 实现经典的 2048 游戏：一步步带你打造属于你的小游戏！一位小说男主 python python 游戏
用Python实现经典的2048游戏：一步步带你打造属于你的小游戏！（结尾附完整代码）简介2048是一个简单而又令人上瘾的数字拼图游戏。玩家通过滑动方块使相同数字的方块合并，目标是创造出数字2048！在这篇博客中，我们将用Python的Tkinter库从零开始实现这款游戏，涵盖从界面设计到逻辑实现的每一个细节，帮助你全面了解背后的开发思路。游戏特点经典玩法：滑动合并相同数字，尽可能达到2048。随
数据挖掘常用算法模型简介大乔乔布斯数据挖掘线性回归决策树
以下是数据挖掘中常用的算法模型及其简称、英文全称和使用场景的简要介绍：1.决策树（DecisionTree,DT）常用算法：CART:ClassificationandRegressionTreeID3:IterativeDichotomiser3C4.5:基于ID3改进使用场景：分类问题（如信用风险评估、客户分类）回归问题（如预测房价）特点：易解释、适合处理非线性数据。2.随机森林（Random
2025 最新flutter面试总结 @福者 Flutter flutter 面试职场和发展
目录1.Dart是值传递还是引用传递？2.Flutter是单引擎还是双引擎3.StatelessWidget和StatefulWidget在Flutter中有什么区别？4.简述Dart语音特性5.Navigator是什么？在Flutter中Routes是什么？6、Dart是不是单线程模型？是如何运行的？7.解释StatefulWidgetLifecycle？8.Dart的事件循环的运行遵循以下规则
Python跨年烟花代码花洵琴
Python跨年烟花代码【下载地址】Python跨年烟花代码分享本资源文件提供了一个使用Python编写的跨年烟花代码，代码中使用了`pygame`、`random`和`math`库来实现烟花的模拟效果。代码中定义了三个类：`Firework`、`Particle`和`Trail`，分别代表烟花、烟花中的颗粒以及颗粒的轨迹点项目地址:https://gitcode.com/open-source-
LeetCode 0040.组合总和 II：回溯 + 剪枝 Tisfy 题解 #力扣LeetCode leetcode 剪枝算法递归回溯
【LetMeFly】40.组合总和II：回溯+剪枝力扣题目链接：https://leetcode.cn/problems/combination-sum-ii/给定一个候选人编号的集合candidates和一个目标数target，找出candidates中所有可以使数字和为target的组合。candidates中的每个数字在每个组合中只能使用一次。注意：解集不能包含重复的组合。示例1:输入:ca
http Accept-Encoding “gzip,deflate,br“ qt c++ 解码爱学习的大牛123 qt开发 windows qt http zip
QtC++处理HTTP请求，并需要解码服务器返回的压缩数据。以下是如何在QtC++中处理这种情况的指南：1.首先，确保您的HTTP请求头中包含了`Accept-Encoding:gzip,deflate,br`，这表明客户端可以接受这些压缩方式。2.当收到服务器响应时，检查`Content-Encoding`头，以确定使用了哪种压缩方法。3.根据压缩方法，使用相应的Qt类来解压数据：-对于gzip
面向接口编程：依赖倒置原则的重要性 xiaogaotongxue__ java设计模式依赖倒置原则
面向接口编程：依赖倒置原则的重要性软件开发中，依赖倒置原则是面向对象编程中的重要设计原则之一。依赖倒置原则的核心思想是高层模块不应该依赖于低层模块，二者都应该依赖于抽象；面向接口编程正是基于这一原则。面向接口编程可以更好地实现依赖倒置原则，通过定义接口来描述模块间的通信规范，从而降低模块间的耦合度。通过面向接口编程，可以实现系统的灵活性、可扩展性和可维护性。举个例子，假设我们有一个系统由三个模块组
Python web框架——Django xiabe python python django web开发
简介django是一个免费的开源的pythonweb框架。它遵循了model-view-template（MVT）的架构模式。由DjangoSoftwareFoundation维护，一个以501©(3)非营利组织形式成立的独立组织。django的主要目标是简单的去开发一个复杂的数据库驱动的网站。该框架强调组件的可重用性和“可插拔性”、代码更少、低耦合、快速开发以及“不要重复自己”的原则。Pytho
LeetCode 第78题：子集题解 Gemini技术窝 leetcode 算法数据结构 java
大家好，欢迎来到《LeetCode趣味解题》！今天我们要讨论的是第78题——子集。这道题目要求我们找出一个集合的所有子集。这就像是在一大堆水果中挑选出所有可能的组合，或是在衣柜中挑选出所有可能的穿搭方式。让我们一起来探索多种解法，深入理解这个问题。文章目录题目描述方法一：递归回溯法思路代码实现代码逻辑流程图方法二：迭代法思路代码实现代码逻辑流程图方法三：位运算法思路代码实现代码逻辑流程图例子分析总
VScode开发STM32 predestination836 vscode stm32 单片机
由于keil5的界面太差（太丑），而VScode的界面，代码提醒等基本完杀keil5，所以VScode负责写代码，keil5负责代码的下载和调试VScode的下载和安装官网地址：https://code.visualstudio.com/但官网下载太慢，这里附上某盘的连接：链接：https://pan.baidu.com/s/10hL0aqUOlbe10fuSSDFS4w?pwd=3ouk提取码：
前端版本号管理：理解和应用山禾女鬼001 前端
在前端开发中，版本号管理是一个非常重要的话题。它涉及到如何标记和管理应用、库、框架以及依赖项的版本，确保开发者和团队成员之间能够协调一致地进行开发，避免因版本冲突带来的问题。今天，我们将深入探讨版本号的基本概念，常见的版本号规范，以及在前端开发中如何使用版本号。一、什么是版本号？版本号是用来标识软件或应用的不同发布版本的一个数字序列。它能够帮助开发者、维护人员和用户区分不同版本之间的差异，明确功能
download-git-repo 一款命令行下载仓库依赖 yqcoder git javascript 前端开发语言 node.js
`download-git-repo`是一个用于从Git仓库下载代码的Node.js工具，它可以从GitHub、GitLab或Bitbucket等Git托管平台下载仓库。一、安装`download-git-repo`npminstalldownload-git-repo二、基本用法1.简单下载//引入`download-git-repo`模块constdownload=require("downl
报错解决记录：Annotation-specified bean name ‘xxx‘ for bean class [xxx]conflicts with existing... hamster2021 spring cloud
问题：对代码做修改后启动服务，爆出了如下错误：2024-11-1321:43:25,564ERROR[main][SpringApplication.java:837]-Applicationrunfailedorg.springframework.context.annotation.ConflictingBeanDefinitionException:Annotation-specifiedb
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d

独家 | 基于NLP的COVID-19虚假新闻检测（附代码）

你可能感兴趣的:(独家 | 基于NLP的COVID-19虚假新闻检测（附代码）)