deephub

假新闻无处不在：我创建了一个通过深度学习的方法标记假新闻的开源项目

虚假新闻的兴起迫使拥有社交媒体帐户的每个人都成为一名侦探，负责在发布前确定帖子是否真实。但是，虚假新闻仍然会越过我们的防线，在网络上迅速扩散，由于用户的无知和粗心而加剧。正如NBC新闻报道所显示的那样，假新闻不仅会散布恐惧和虚假信息，而且还可能对公司和个人的声誉造成损害。为了减少错误信息的直接和间接损失，我们需要更好的方法来检测虚假新闻。尽管有些虚假新闻是由真实的人撰写的，并且简直像是小说，但利用深度学习模型也可以大量生成虚假新闻，从而加剧了这一问题。到目前为止，计算机生成的文本已经很容易与真人写作的文本区分开。但是，由于自然语言生成模型的巨大改进，计算机生成的文本现在比以往任何时候都更加可信，因此这个问题变得更加紧迫。

假新闻无处不在-关键是如何制止它。

在过去的三年中，Transformer（变形器）席卷了自然语言处理任务。像几年前最先进的长期短期记忆体系结构这样的神经网络已经被BERT（来自变形器的双向编码器表示）和OpenAI强大的新模型GPT-2（生成预训练的变形器2）超越了。这些变形器现在以准确的分类和听起来不错的生成文本引领行业。举例来说，由GPT-2生成的文本是如此真实，以至于OpenAI最初拒绝发布完整的受训模型，理由是“对技术和程序的恶意应用的担忧”。

区分真实和虚假新闻很重要，但要解决一个难题，而对于新模型，这个问题变得更加困难。该项目旨在探索假新闻产生和发现方面的挑战。

项目目标

通过比较长期短期记忆（LSTM）残差神经网络和OpenAI的最新变形器GPT-2生成的文本，简要演示自然语言生成模型的改进。
使用区分符尝试准确分类文本是由最新的深度学习模型还是由人生成。

项目概况

该项目分为以上两个主要部分。第二部分-查找，训练和使用判别器对生成的文本进行分类-这将是一项重大挑战，因为计算机生成的文本已经变得很难与人类书写的区分开。

首先，对许多模型进行了研究和评估。通常选择预训练的模型版本，因为它们无需进行数天的训练即可实现最新性能。使用Kaggle数据集的子集对LSTM模型进行了微调。用于微调的数据由《纽约时报》，《布赖特巴特》，CNN，《商业内幕》，《大西洋》，《福克斯新闻》，《谈话要点备忘录》，《 Buzzfeed新闻》，《国家评论》，《纽约邮报》，《卫报》，NPR，路透社，Vox和《华盛顿邮报》提供。根据Kaggle上的文档，大多数文章来自2016年和2017年，而较少的文章来自2015年及之前。 OpenAI在GPT-2的文档中写道，它在针对特定内容的任务上表现良好，例如生成伪造的新闻，而无需进行微调或重新训练，因此项目使用了GPT-2的原始权重。

为了检测假新闻，从真实新闻文章中传递了GPT-2模型的种子。从该种子中，模型生成长格式的文本，最多可包含500多个令牌（可以将标记视为单词和标点符号。）。结果，对于每篇“真实”文章，都有一个生成的长格式文本，它们共享一个共同的第一句。使用称为GLTR的工具，通过比较它们的功能来检查每个生成的文本和真实文章。最后，将所有文章分为训练和测试集，并训练了BERT二进制分类器以对“伪造”文本进行分类。

第一部分：LSTM与Transformer

自从变形器问世以来，自然语言的产生难度已经大大减小

模型的选择和依据

该团队探索了使用LSTM（长期短期记忆）架构和变形器架构的文本生成模型。在2017年推出变形器之前，LSTM被认为是NLP任务的标准。被允许进行比较，并检查该领域取得的进展。

LSTM（长期短期记忆）是一种递归神经网络，它是一种试图对依赖于序列的数据进行建模的模型。这使LSTM成为文本生成的可行候选者。在LSTM体系结构中，LSTM单元块代替了标准神经网络层。这些单元由输入门，忘记门和输出门组成。

LSTM模型由德国计算机科学家JürgenSchmidhuber和Sepp Hochreiter于1997年首次提出。他们的出版物描述了他们所做的研究，自1997年以来，LSTM有了新的改进，例如增加了遗忘门以及添加了架构中从单元到门的连接。

该代码取自Keras的官方文档，该文档最初用于从尼采的作品中生成文本。使用LSTM模型引起的问题是随机的，并且很难用固定随机种子来获得100％可再现的结果。因此，尽管LSTM模型的结果很有趣，但是对于该项目的目标而言，它却并非有用。

除了使用LSTM检查文本生成之外，该团队还使用来自OpenAI的名为GPT-2的变形器生成了文本。自Vaswani等人发表学术论文“注意力就是你所需要的”以来。在2017年，通过使用一种称为注意力的技术，变形器架构已经超越了先前模型的性能。 Miguel Romero Calvo在他在Medium上发表的这篇文章中很好地解释了注意力如何作用于变形器的编码器部分，以及编码器和解码器如何配合在一起构成变形器。如果您已经熟悉这些体系结构，或者对学习如何使用它们的更多技术性知识不感兴趣，请继续阅读本文。您无需应用这些概念即可了解项目和其结果。

OpenAI的GPT-2是代表从变形器模型生成最新文本的显而易见的选择。该架构是专为文本生成而设计的，与BERT不同，它是Google AI语言研究人员的另一种著名转换器。 GPT-2也因其类似于人的性能而产生了很多新闻。

GPT-2模型是使用变形器的解码器模块构建的，并且像传统语言模型一样，一次输出一个令牌。它使用字节对编码在其词汇表中创建令牌。这意味着标记通常是单词的一部分。

GPT-2在800万个网页的数据集中进行了培训，总共大约40Gb的互联网数据。根据OpenAI的说法，他们仅使用由人类策划/过滤的页面-具体来说，他们使用Reddit的出站链接，该链接至少获得了3业力。这为模型提供了自然语言生成的好方法。

该语言模型有一个简单的目标：给定文本中的所有先前单词，从而预测下一个单词。

GPT-2至少有四个版本：

“小”：1.24亿个参数，占用内存500MB
“中”：3.55亿个参数，占用内存1.5GB
“大”：7.74亿个参数
“特大”：15.58亿个参数，称为“完整”或“真实模型”，可能占用超过6.5 GB的空间

在所有这些模型可用的情况下，需要权衡取舍：大型模型的总体性能较好，这意味着使用较大模型时它们会创建更可信的文本，但需要花费更长的时间进行微调来生成文本。为了利用所谓的类人性能，同时仍具有足够小的模型来运行多个文本，选择了GPT-2的“中型”版本来代表模型的变形器。

性能比较

LSTM Sample生成的文本（种子文本为粗体）：

**‘face reality as it is, not as it was, or as you would wish it to be,’ said the late *, gadantural can chas and into the sussex and the prince and the salment for crisis. could state of the last week and and comparations and protective and the patient the royal of the cambridge the lead and pats for charles and cases and strip the first were from the royal and and raching her was she was known and the said of the grounds and and and the condition to according to free discoverns, and contact with the countries and one and the retarry report the monarchand self-inst stray days. health to the cases that she said the monarch strand self-may for the world the group and the lives.

在后期，gadantural可以追赶并进入苏塞克斯和王子和危机的薪水。可以说明上周的情况，进行比较和保护，病人是剑桥王室成员，负责查理和案件的拍打，并剥夺了第一位来自王室成员的东西，并强奸了她，她是众所周知的，理由是并根据自由发现的条件，与各国联系，并与一名退休人员汇报君主的流浪日子。她说，君主处境自给自足，可以为整个世界的群体和生命带来健康。”

给定文本的情况下的结果并不理想。句子不连贯，有些单词似乎没有意义。鉴于这是一个较早的LSTM，因此还使用了较新版本的基于RNN的生成器来生成示例文本。这些改进的文本模型可更好地比较RNN的功能。

RNN示例生成的文本（种子文本为粗体）：

**“ the university of texas at austin, *. and, a group of reporters from the list of russian athletes, but also the same, as mr. trump has said he would not be able to get out of the way, but it is not uncommon for the past five years, ” mr. said. “ we ’ re not going to let me go to school and tell us that they were in a small town outside the old house, a team of researchers at the university of washington, said in a statement. “ we are not giving you to a college or a school. “ i didn ’ t want to do it, ” said michael, a lawyer for the trump organization, he said, “ i feel that i could have left him to the apartment, and the city ’ s house, and the president of the united states, said the government had been “ more ” than the evidence. mr. trump had been a target of the terrorist attack in syria. the country is about the size of the crowd”

德克萨斯大学奥斯汀分校，德克萨斯。还有来自俄罗斯运动员名单的一组记者，但也与先生相同。特朗普表示，他将无法摆脱困境，但在过去五年中并不少见。说过。华盛顿大学的一组研究人员在一份声明中说：“我们不会让我上学，告诉我们他们在老房子外面的一个小镇里。 “我们不是在给你上大学或学校。 “我不想这么做，”特朗普组织的律师迈克尔说，“他说，“我觉得我本可以把他留给公寓，城市的房屋以及联合总统的。州说政府比证据“更多”。先生。特朗普曾是叙利亚恐怖袭击的目标。这个国家大约是人群的大小

这段文字虽然有些奇怪，但看起来更加连贯，并证明了基于LSTM的生成器可以在生成文字方面做得相当好。相同的种子已传递给GPT-2生成器，以更好地进行比较。

GPT-2示例生成的文本（种子文本为粗体）：

The University of Texas at Austin is offering a hefty $60,000 scholarship for female robotics students who want to help their career. In the online portion of the program, participants will work with one of the university’s research teams and create an animated robot that can navigate a physical space.*

The average college student wants to design a product and execute an idea and potentially earn a job. Often, this isn’t possible, so this type of program creates more jobs, says artist Aritappa Chatterjee, who came up with the concept for ‘Smart Robotics Lab.’

德克萨斯大学奥斯汀分校将为想要帮助其职业生涯的女机器人学生提供6万美元的巨额奖学金。在该计划的在线部分，参与者将与该大学的一个研究团队合作，并创建一个可以在物理空间中导航的动画机器人。

普通大学生希望设计产品并执行想法并可能获得工作。艺术家Aritappa Chatterjee提出了“智能机器人实验室”的概念，他说，通常这是不可能的，因此这类程序可以创造更多的工作。

奖学金适用于大二，初中或高三的学生。

“学生们正在确定这些女性占主导地位的领域，所以我们……”

结果与预期结果相符：GPT-2创建了可信的短文本，文本越长，与真实文本的差异就越大。尽管该模型能够保持一致的结构，但在仔细检查后，内容似乎牵强。

该模型具有“温度”设置，可以在0到1的范围内选择一个超参数。温度越高，模型获得的“创意”就越多，这意味着它不会添加最可能的下一个单词，而会从更大的池中采样。我们选择了0.7作为此超参数的值，这提供了看似最一致的内容创建。

从示例中可以明显看出，GPT-2在生成文本方面比基于LSTM的模型表现更好。此处选择的示例可以看作是“cherry-picking”，但是随机选择的，通常代表整体观察到的模式。

简单示例

本文的标题是由GPT-2模型生成的，该模型在过去6个月中对来自arxiv.org的与机器学习相关的文章标题进行了微调。

生成标题

引语是本文的开篇段落：“虚假新闻的兴起迫使拥有社交媒体帐户的每个人都成为侦探，负责在发布前确定帖子是否真实……”

完整的输出为：“调查社交媒体上的虚假新闻：首先是一种用于打击错误信息的深度学习方法？” ，粗体文本保留为标题。

第二部分：假新闻检测

鉴别器

鉴别器是一种深度学习模型，可对不同生成过程产生的样本进行分类（区分）。鉴别器通常用于生成对抗神经网络（GAN），该网络与生成器协同工作以迭代地改进生成过程，使其输出越来越类似于“真实”示例。出于识别GPT-2生成的文本的目的，一种相似类型的鉴别器很有吸引力，但是所使用的过程并不涉及反复训练生成器和鉴别器。此外，人类很难识别生成的文本，因此人们对这种模型的潜在性能持怀疑态度。

为了从不同的角度解决问题，如果生成的文本和真实的文章共享相同的主题，那么对生成的文本和真实的对应词之间的相似性进行度量可能会为生成的文本的特征提供一些信息。用于基于“相似度”比较文本的第一种方法是一种称为bertScore的改进量度，该度量计算两个句子中单词的余弦相似度。

尽管从表面上看，这种实现方式似乎很有希望，但却不能说明所使用的生成模型所展现的“创造力”。尽管确实可以计算相似度并进一步分析相似性，但是生成的文本与原始文本有很大的不同。从一条有关一名新奖学金获得者的新闻中摘录的一句话，可能会产生一个有关年轻聪明的策划者抢劫珠宝的文字。事实证明，在不同的情况下评估相似性无助于提供洞察力，因为该指标仅报告所生成的文本与原始文章有很大不同。

在评估这种相似性度量时，观察到生成的文本倾向于使用不太复杂的词汇，并且通常依赖于重复短语。相比之下，原始新闻更倾向于带有逻辑故事情节，并传递各种主题和思想。这一发现促使人们对诸如巨型语言模型测试室之类的工具进行了更多研究，这些工具似乎也取决于生成文本的复杂性和多样性。

巨型语言模型测试室（GLTR）是由哈佛大学NLP与MIT-IBM Watson AI Lab合作创建的。该工具使用了BERT和GPT-2模型，可以逐字逐句查看该单词在句子中接下来被选中的可能性。在下面的图片中，绿色表示最有可能出现的单词中的前10个单词，黄色表示最常见的单词中的前100个，红色表示最常见的单次中的前1000个单词，紫色则表示1000后的单次。这表示绿色单词可能是模型输出的下一个单词，并且随着该单词变得不太可能被模型选择，它会落入其他颜色容器之一中。例如，以下图片是人类撰写的《纽约时报》文章的摘要。本文有几个可预测的词，但也包含许多生成模型将不太可能选择的词。这是因为人类在写作时不会考虑最可能出现的下一个单词。他们考虑哪个词最适合写作的上下文以及他们试图传达的想法。

下面的四个图像显示了单词分布的差异。当将GLTR工具与GPT-2鉴别器一起使用时，虚拟文章（左上）比其真实对应词（右上）具有更高的可预测单词分布。在虚拟文章（左下方）和真实文章（右下方）上使用BERT鉴别器时，发现了类似的模式。使用这两种区分器，在生成器和人类创造的结果中这两个词之间有明显的区别。这支持了我们的推论，即生成器将仅基于单词的概率而非上下文来构造文本。尽管该项目没有开发出用于确定文本是否由计算机生成的数值度量，但是查看GLTR的输出可以提供一些见解。

根据上述限制，寻求第二种鉴别器。在研究假新闻鉴别器时，一些作者分享了使用BERT编码器和某种分类器的成功经验。选择BERT编码器和BERT二进制分类器的组合是因为它们具有输出/输入兼容性，并且在Python中实现了分类器。尽管Medium文章的原作者对该分类器表示了很高的期望，但是该模型的计算很费时间（估计需要花费15-21个小时才能运行一个流程），并且在该项目的实验运行中，无法对“真实”分类并以比简单猜测更好的速度生成文本。我们的实现可能太简单了，在传递给BERT编码器之前，应该在输入上包含其他工程。或者，此功能增强在BERT编码器和BERT二进制分类器之间可能很有用。但是，为该项目所做的工作没有提供帮助，表明这种额外的努力可能会产生所需的准确性。

BERT分类器的缺点表明了最新的自然语言生成模型的出色性能。鉴别器有可能依赖于复杂性和创造力的度量，以及整体连贯性的度量。像GPT-2这样的模型可能会欺骗鉴别器，该鉴别器只是为最有可能被选中的前10名或前100名中的单词设置频率的阈值。可以通过提高模型的温度来做到这一点，让模型有更多的自由来探索鉴别器可能认为“不太可能”的词和概念。但是，如果分类器也可以衡量整篇文章的连贯性，那么它会更容易地识别出所生成的那些文本，因为更多的“创意”文本往往对阅读它们的人来说意义最小。

未来可能使用的领域

创建一个针对复杂性/创造力的评分指标
创建使用此指标的假文本分类器
进一步检查“假文本”的特征
使用白盒对抗攻击（white box adversarial attack）来观察哪些功能使文本更容易被伪造

结论

该项目说明了自然语言生成模型在过去三到四年中的进展：从LSTM的不连贯性到现在由OpenAI开发的听起来流利的GPT-2模型。生成文本模型没有“真实”或“伪造”的感觉，因此听起来逼真的生成模型几乎肯定会导致令人信服的“假新闻”。展望未来，人工智能研究人员，学者和行业领导者将面临越来越不可能的任务，即寻找方法来识别机器生成的文本。

作者：Martin Beck, Rachel Meade, Darasimi Oluwaniyi, Sasha Opela, Sebastian Osorio, Jackson Ross, Dhrov Subramanian

deephub翻译组：孟翔杰

获取关注公众号获取github连接

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23