weixin_30352645

论文阅读 | Generating Fluent Adversarial Examples for Natural Languages

Generating Fluent Adversarial Examples for Natural Languages ACL 2019

为自然语言生成流畅的对抗样本

摘要

有效地构建自然语言处理(NLP)任务的对抗性攻击者是一个真正的挑战。首先，由于句子空间是离散的。沿梯度方向做小扰动是困难的。其次，生成的样本的流畅性不能保证。在本文中，我们提出了MHA，它通过执行Metropolis-Hastings抽样来解决这两个问题，其建议是在梯度的指导下设计的。在IMDB和SNLI上的实验表明，我们提出的MHA在攻击能力上优于基线模型。使用MHA进行对抗性训练也会带来更好的健壮性和性能。

1 介绍

对抗性学习是深度学习中的一个热门话题。攻击者通过扰动样本生成对抗性样本，并利用这些样本欺骗深度神经网络(DNNs)。从防御的角度出发，将对抗性样本混合到训练集中，提高了受害者模型的性能和鲁棒性。然而，为NLP 模型(例如文本分类器)构建攻击者是非常困难的。首先，由于句子空间离散，基于梯度的微扰难以实现。然而，梯度信息是至关重要的，它导致最陡的方向，以更有效的样本。其次，对抗性的样本通常不是流利的句子。不流畅的样本在攻击中效果较差，因为受害者模型可以很容易地学会识别它们。同时，对它们进行对抗性训练通常效果不佳(详细分析见图1)。目前的方法不能很好地处理这两个问题。

易卜拉欣等(2018)(HotFlip)提出通过翻转一个字符来扰乱一个句子，并使用每个字符的梯度来指导样本的选择。但是简单的字符转换常常导致无意义的单词(例如。"mood”到“mooP”)。遗传攻击(Alzantot•et al.， 2018)是一个基于种群的词替代攻击者，其目的是通过语言模型过滤掉不合理的句子，生成流畅的句子。但遗传攻击证明的样本生成的流畅性仍不理想，当梯度被丢弃时，它的效率较低。

针对上述问题，本文提出了基于MHA算法的算法。MHA是基于Metropolis- hastings (M-H)采样的对抗样本生成(Metropolis et al., 1953; HASTINGS, 1970; Chib and Greenberg, 1995).。M H采样是一种经典的MCMC采样方法，在许多NLP任务中得到了应用。

两种MHA变体：黑盒 MHA 白盒MHA b-MHA w-MHA

具体来说，与以往的M-H语言生成模型相比，b-MHA的静态分布具有一个语言模型项和一个对抗攻击项。这两个术语使得对抗样本的生成流畅而有效。w-MHA甚至将对抗性梯度合并到提案分发（？ proposal distributions）中，以加快对抗样本的生成。

我们的贡献包括提出了一个有效的方法来生成流畅的反例。IMDB (Maas et al.， 2011)和SNLI (Bowman et al.， 2015)的实验结果表明，与最先进的生成模型相比，MHA生成样本的速度更快，在专业上的成功率更高。同时，MHA的对抗性样本在经过对抗性训练后，不仅更加流畅，而且更加有效，提高了对抗性的鲁棒性和分类精度。

2 准备工作

victim models 受害者模型是单词级的，它接受标记化的句子并输出它们的标签。攻击者通过扰乱原句来生成句子，从而误导受害者模型犯错误。对抗攻击包括两类:(a)黑盒 (b) 白盒。对于对抗性训练，在包含对抗性样本的更新训练集上从零开始训练相同的受害者模型。

3 MHA

主要讲M-H抽样，以及如何使用M-H抽样有效地生成自然语言的对抗样本。

3.1 Metropolis-Hastings Sampling

M-H算法是一种经典的马尔可夫链蒙特卡罗抽样方法。考虑到最优分布(Π(x))和转换建议 transition proposal，M-H能够Π(x)生成理想的样本。具体地说，在每个迭代中，根据建议分布(g(x' | x))提出一个从x跳到x'的建议。建议获接纳的概率由接纳率 acceptance rate给出:

一旦接受，算法跳到x’，否则停留在x。

3.2 黑盒攻击

在黑盒攻击(b-MHA)中，我们期望样本满足三个要求:(a)具有较强的阅读能力;(b)能够愚弄分类器;(c)尽可能少地调用分类器。

平稳分布 Stationary distribution。为满足这些要求，平稳分布设计为:

其中LM(x)为预训练语言模型（LM）给出的句子(x)的概率和C(y~ | x)为受害者模型给出的错误标签(y~)的概率。LM(x)保证流畅性，而C(y~|x)是攻击目标。

转换建议 Transition proposal。有三种字级转换操作——替换、插入和删除。遍历索引用于选择执行操作的单词。假设MHA在第t个proposal上选择第i个单词(wi)，然后在(t + 1)-th proposal上，受影响的单词(w*)为: （下一个单词）

替换的过渡函数如式3所示，其中w m为被替换的选定单词，Q为预选候选集，待会解释。插入操作由两个步骤组成——将一个随机单词插入该位置，然后对其执行替换。删除操作相当简单。，其中x-m为删除第m个单词(wm)后的句子，。

建议分布为过渡函数的加权和:

其中pr、pi、pa为操作的预定义概率。

预选。

预选器生成的候选集。它根据分数(SB (wlx))选择最可能的单词组成候选单词集Q，SB(wlx)表示为:

x (1: m - 1) = | w1 . .，w m-1}为句子的前缀，X m+1:nl为句子的后缀，LM为预先训练好的后向语言模型。如果没有预选，Q会将词汇表中的所有单词都隐藏起来，并且会反复调用分类器来计算公式3的分母，这是低效的。（有预选的话相当于这个概率就是确定的了，不用再计算概率了。但是这一有个缺点在于，如果单词特别多，可能需要LM生成大量结果）

3.3 白盒攻击

白盒攻击(wmha)和b-MHA的唯一区别在于预选器。

预选。在w-MHA中，梯度被引入预选分数(SW (w|x))。sW (wlx)表示为:

其中S为余弦相似函数，L~ =为目标标签上的损失函数，em和e为当前单词(wm)和替代(w)的嵌入。梯度会导致最大的方向,和em-e 是真实的改变方向（如果他们被em被e替换）。余弦相似性术语引导样本一起跳到梯度的方向,提出了C(y~ | C)和α (x' | x),甚至性使w-MHA更有效率。

注意，插入和删除被排除在w-MHA中，因为很难计算它们的梯度。以插入操作为例。可以在b-MHA中应用类似的技术，首先插入一个随机的单词形成中间语句x*= {u1，，。， Wm, w*， Um+1，。， un}，然后在x*上进行每个成形替换操作。计算很简单，但它不是实际的梯度。实际梯度的计算很难，因为从x到x*的变化是离散的、非微分的。

4 实验

数据集。在前面的工作中，我们对所提出的MHA在IMDB和SNLI数据集上的性能进行了测试。IMDB数据集包括25,000个训练样本和25,000个电影评论测试样本，并带有情感标签(正面或负面)。SNLI数据集包含55,000个训练样本、10,000个验证样本和10,000个测试样本。每个样本都包含一个前提、一个假设和一个推断标签(隐含、矛盾或中性)。我们在IMDB和SNLI上分别采用单层bi-LSTM和BiDAF模型(Seo et al.， 2016)(该模型采用双向注意流机制捕捉句子对之间的关系)作为受害者模型。

基线遗传攻击者。我们采用最先进的基因攻击模型(Alzantot等。作为我们的基线，它使用了一个基于无梯度的种群算法。从直观上看，它主要是获得一个句子的总体，不考虑受害者模型，而是根据嵌入层距离进行词级替换，扰乱句子。然后，中间句是通过受害者分类器和一个语言模型得到了下一代。

Hyper-parameters。如苗等人的作品。(2018)， MHA最多只能提出200次建议，每次迭代我们预先选择30个候选。MHA中包含了一些限制，以禁止对感情用事的词或否定词进行任何操作(例如。“great”或"not"。在IMDB使用感知网络(Esuli和Sebas tiani)进行实验。2006: Baccianella等。2010)。所有受害者模型中的LSTMs都有128个单元。受害者模型在IMDB和SNLI上的测试正确率分别达到83.1%和81.1%。这些都是可以接受的回答。附录中包含了更详细的超参数设置。

4.1 对抗攻击

为了验证攻击效率，我们分别从IMDB和SNLI测试集中随机抽取1000个和500个正确分类的样本。攻击成功率和调用时间(受害者模型)用于测试效率。如图3所示，我们提出的MHA曲线高于遗传基线，说明MHA的有效性。将梯度信息引入到方案分布中。随着曲线的快速上升，w-MHA甚至比b-MHA表现得更好。注意梯子的形状遗传方法的曲线是由它的脉动特性引起的。

我们在表1中列出了详细的结果。通过调用受害者模型最多6000次，可以获得成功率。如图所示，模型之间的成功率差距不是很大，因为所有的模型都能给出相当高的成功率。然而，正如所料，我们提出的MHA提供了较低的perplexity (PPL) 1，这意味着MHA生成的样本更有可能出现在评估语言模型的语料库中。由于语料库足够大，用于评价的language模型足够强，所以在dicates中MHA生成的样本更有可能出现在自然语言空间中。它甚至能让你更流利。

还进行了人工评估。从这三种方法都成功攻击的样本中，我们在IMDB上取样了40个样本。三个志愿者被要求对生成的样本进行标记。使用受害者分类器的假标签和vol unteers的真标签的样本被视为实际的对抗性测试组。与之相对的样本比例的遗传。方法中，b-MHA和w-MHA分别为98.3%、99.2%和96.7%，说明生成的样本几乎都是对抗样本。卷测试者还被要求对生成的考试组在SNLI上的流利程度进行排名(“1”表示最流利，“3”表示最不流利)。上面提到的20个例子都是以同样的方式进行的。遗传方法、b-MHA和w-MHA的排序均值为1.93 1.80和2.03，表明b-MHA生成的样本最流畅。由W-MHA生成的样本不如遗传方法流畅。这可能是因为预选器中引入的梯度会影响句子的流畅性，从人的角度来看。

不同模型或SNLI的反例如表2所示。遗传方法可以用不同的时态来代替动词，也可以用不同的复数来代替名词，从而导致语法错误。(如例1)，而MHA使用语言模型来表示平稳分布，以避免这种语法错误。MHA并没有限制单词替换应该具有简单的含义。MHA可能会用一些不相关的词来代替实体或动词，导致原句的意思发生变化(如:例2)。更多的案例包括在附录中。

4.2 对抗性训练

为了验证对抗性训练是否有助于提高受害者模型的对抗性鲁棒性或分类精度。将生成的样本混合到训练集中，从零开始训练新的模型。为了检验模型的抗对抗鲁棒性，我们在IMDB上采用了各种方法对新模型进行攻击。如表3所示，经过遗传逆向训练的新模型不能防御MHA。相反，采用b-MHA或w-MHA de进行对抗性训练会降低遗传攻击的成功率。它显示了来自MHA的反例可能比来自于genetic at tack的反例更有效，如图1所示。

为了检验新模型在对抗性训练后是否能达到精度的提高，我们对不同大小的训练数据进行了实验，这些数据都是SNLI训练集的子集，实验中对抗性样本的数量固定为250个。表4列出了不同方法对抗性训练后新模型的分类精度。使用w-MHA进行Adver sarial训练可以显著提高这三种设置的准确性(p值小于0.02)。W-MHA在10K和30K训练数据上优于遗传基线，并与100K训练数据得到了类似的改善。较少的训练数据导致较大的accu快速增益，而MIHA在较小的训练集上的性能明显优于遗传方法。

5 未来工作

当前的MHA在标签发生变化时返回样本，这可能导致句子的时态不完整，从人类的角度来看，句子时态并不流畅。诸如强制模型在返回前在句尾生成(EOS)之类的约束可能会解决这个问题。

此外，没有限制的实体和动词替换对NLI等任务的对抗的前几代有负面影响。在词的运算过程中，相似度的限制是解决这一问题的关键。诸如模仿嵌入距离之类的约束可能会有所帮助。另一种解决方法是在预选源中嵌入距离的逆。

6 结论

在本文中，我们提出了MHA，它采用MH抽样的方法，为自然语言生成对抗样本。实验结果表明，我们提出的MHA能够比生成基线更快地生成反例。从MHA中获得的对抗样本更流畅，对对抗性训练可能更有效。

思考：

1. 解决的问题

生成的对抗不流畅的问题

2. 解决的方法

MHA黑盒白盒

3. 优缺点

优点：流畅样本攻击高效

缺点：抽样的准确性问题。替换的词偏差过大的问题。

找这篇文章的附录和其他复现

转载于:https://www.cnblogs.com/shona/p/11354327.html

Assembly语言的自然语言处理花韵婷包罗万象 golang 开发语言后端
Assembly语言在自然语言处理中的应用引言自然语言处理（NaturalLanguageProcessing,NLP）作为人工智能的一个重要分支，致力于实现计算机与人类语言之间的互动。随着计算能力的提升以及大数据的蓬勃发展，NLP在各个领域的应用如火如荼。从语音识别、机器翻译到情感分析等，NLP正在改变我们与信息之间的互动方式。不过，当前主流的NLP研究通常是用高级编程语言（如Python、Ja
《数据挖掘导论》第二章数据爱吃草莓的西瓜酱数据挖掘导论数据挖掘
第二章数据数据类型数据质量数据预处理相似度测量数据Collectionofdataobjectsandtheirattributes特征值数值型的或者描述性的（男/女-->0/1）特征和特征值之间的区别：相同的属性可能被赋予不同的特征值，如身高的单位可能是米或者英尺不同的属性可以映射到相同的值集，如ID是无界的，age有最大值和最小值1.特征的类型Nominal（标称）Examples:IDnum
vscode语言支持插件开发 amux9527 笔记 vscode typescript 编辑器
安装脚手架npminstall-gyogenerator-code生成插件模板yocode配置语言支持我这里就自定义一种以.da结尾的语言，修改根目录下的package.json文件的contributes处的属性{"contributes":{"languages":[{"id":"da","aliases":["DA"],"extensions":[".da"],"icon":{"dark":
React Next项目中导入Echart世界航线图一朵好运莲 react.js javascript ecmascript
公司业务要求做世界航线图，跑了三个ai未果，主要是引入world.json失败，echart包中并不携带该文件，源码的world.json文件页面404找不到。需要自己寻找。这是整个问题卡壳的关键点，特此贴出资源网址。一、安装npminstallecharts二、下载world.jsonworld.json在最下面，点开直接粘贴到自己项目中引入Indexof/examples/data/asset
Python数据分析NumPy和pandas（十七、pandas 二进制格式文件处理） FreedomLeo1 Python数据分析 python 数据分析 pandas HDF5 PyTables h5py Excel
以二进制格式存储（或序列化）数据的一种简单方法是使用Python的内置pickle模块。同时，pandas构造的对象都有一个to_pickle方法，该方法以pickle格式将数据写入磁盘。我们先把之前示例用到的ex1.csv文件加载到pandas对象中，然后将数据以二进制pickle格式写入examples/frame_pickle文件中：importpandasaspdframe=pd.read
OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file, 小李飞刀李寻欢 Notebook huggingface bert 分类大模型
场景：训练bert-base-chinese下游任务：分类。在一个服务器可以用，但GPU只有一个卡，只能换一个服务器，换个服务器又要重装环境，但后者下载模型有问题，手动用git-lfs下载后指定位置报错：Traceback(mostrecentcalllast):/examples/pytorch/text-classification/run_glue.py",line622,inmain()/
[论文精读]AI-Guardian: Defeating Adversarial Attacks using Backdoors 0x211 论文精读人工智能
会议名称：2023IEEESymposiumonSecurityandPrivacy(SP)发布链接：AI-Guardian:DefeatingAdversarialAttacksusingBackdoors|IEEEConferencePublication|IEEEXplore中文译名：AI-Guardian:利用后门防御对抗攻击阅读原因：网安相关，方班需要本文主要介绍了一种名为AI-Guar
论文阅读：Personalized Purchase Prediction of Market with Wasserstein-Based Sequence Matching Narcissus`小暮一步步来学大数据推荐系统
PersonalizedPurchasePredictionofMarketwithWasserstein-BasedSequenceMatching概述问题背景及陈述预测算法步骤一：itemembeddings步骤二：计算wassersteinDistance步骤三：Wasserstein-BasedDynamicTimeWarping预测实验评价标准数据集对比的baseline结论市场篮子的应
论文阅读笔记：Graph Matching Networks for Learning the Similarity of Graph Structured Objects 游离态GLZ不可能是金融技术宅知识图谱机器学习深度学习人工智能
论文做的是用于图匹配的神经网络研究，作者做出了两点贡献:证明GNN可以经过训练，产生嵌入graph-leve的向量可以用于相似性计算。作者提出了一种新的基于注意力的跨图匹配机制GMN(cross-graphattention-basedmatchingmechanism)，来计算出一对图之间的相似度评分。（核心创新点）论文证明了该模型在不同领域的有效性，包括具有挑战性的基于控制流图(control
论文阅读 EEG-TCNet Plan-C- 论文阅读
EEG-TCNet:AnAccurateTemporalConvolutionalNetworkforEmbeddedMotor-ImageryBrain–MachineInterfaces1.Intrduction本文提出了一种新颖的时间卷积网络（TCN），在需要很少的可训练参数的情况下实现了出色的精度。EG-TCNET成功地推广了单个数据集，通过0.25的元效应优于MOABB的当前最新技术水平
论文阅读《Semantic Stereo Matching with Pyramid Cost Volumes》 cunese0088 深度学习
SSPCV-Net（语义立体匹配网络）目的：进一步捕捉视差的细节主要模块：数据集：SceneFlow,KITTI2012,KITTI2015,Cityscape(比较泛化能力)-------------------------------------------------------------------------------------------------------Concatevo
论文阅读笔记——π0: A Vision-Language-Action Flow Model for General Robot Control 寻丶幽风论文阅读笔记论文阅读笔记人工智能机器人语言模型
π0论文π0π_0π0是基于预训练的VLM模型增加了actionexpert，并结合了flowmatching方法训练的自回归模型，能够直接输出模型的actionchunk（50）。π0采用FlowMatching技术来建模连续动作的分布，这一创新使模型能够精确控制高频率的灵巧操作任务，同时具备处理多模态数据的能力。架构受到Transfusion的启发：通过单一Transformer处理多目标任务
【论文阅读】Learning Transferable Visual Models From Natural Language Supervision（2021） Bosenya12 论文阅读
摘要State-of-the-art（最先进的）computervisionsystems（计算机视觉系统）aretrainedtopredictafixedsetofpredeterminedobjectcategories（被训练来预测一组固定的预定对象类别）.Thisrestrictedformofsupervision（受限制的监督形式）limitstheirgenerality（通用性）
InternVL：论文阅读 -- 多模态大模型(视觉语言模型) XiaoJ1234567 LLM 论文阅读语言模型人工智能多模态大模型 internVL
更多内容：XiaoJ的知识星球文章目录InternVL:扩展视觉基础模型与通用视觉语言任务对齐1.概述2.InternVL整体架构1）大型视觉编码器：InternViT-6B2）语言中间件：QLLaMA。3）训练策略（1）第一阶段：视觉-语言对比训练（2）第二阶段：视觉语言生成训练（3）第三阶段：监督微调（SFT）3.InternVL应用1）对于视觉感知任务2）对于对比任务3）对于生成任务4）对于
论文阅读-秦汉时期北方边疆组织的空间互动模式与直道的定位（中国） MilkLeong 论文阅读空间计算
论文英文题目：AspatialinteractionmodelofQin-HanDynastyorganisationonthenorthernfrontierandthelocationoftheZhidaohighway(China)发表于：journalofarchaeologicalscience，影响因子：3.030论文主要是使用空间互动模型来对秦汉时期的北方边疆直道进行定位和重建。分析
Canvas资源宝典：全面探索HTML5 Canvas技术支然苹
Canvas资源宝典：全面探索HTML5Canvas技术awesome-canvasAcuratedlistofawesomeHTML5Canvaswithexamples,relatedarticlesandposts.项目地址:https://gitcode.com/gh_mirrors/aw/awesome-canvas一、项目介绍项目概述awesome-canvas是由RaphaëlMor
《Natural Actor-Critic》译读笔记 songyuc 笔记
《NaturalActor-Critic》摘要本文提出了一种新型的强化学习架构，即自然演员-评论家（NaturalActor-Critic）。Theactor的更新通过使用Amari的自然梯度方法进行策略梯度的随机估计来实现，而评论家则通过线性回归同时获得自然策略梯度和价值函数的附加参数。本文展示了使用自然策略梯度的actor改进特别有吸引力，因为这些梯度与所选策略表示的坐标框架无关，并且比常规策
Voice Translation of Audio Files into Different Languages Using Gpt-4o 开发者每周简报 ffmpeg 人工智能
openai-cookbook/examples/voice_solutions/voice_translation_into_different_languages_using_GPT-4o.ipynbatmain·openai/openai-cookbook·GitHub您是否曾经想将播客翻译成您的母语？翻译和配音音频内容可以使其更便于全球观众理解。借助GPT-4o的全新音频输入和音频输出模式
论文阅读笔记——Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware 寻丶幽风论文阅读笔记论文阅读笔记人工智能深度学习机器人
ALOHA论文ALOHA解决了策略中的错误可能随时间累积，且人类演示可能是非平稳的，提出了ACT（ActionChunkingwithTransformers）方法。ActionChunking模仿学习中，compoundingerror是致使任务失败的主要原因。具体来说，当智能体（agent）在测试时遇到训练集中未见过的情况时，可能会产生预测误差。这些误差会逐步累积，导致智能体进入未知状态，最终
用python 的 sentiment intensity analyzer的情感分析器，将用户评论进行分类 max500600 python 算法 python 分类人工智能
SentimentIntensityAnalyzer是nltk（NaturalLanguageToolkit）库中的一个工具，用于进行情感分析。它会为文本返回四个得分：负向情感得分（neg）、中性情感得分（neu）、正向情感得分（pos）和综合得分（compound）。综合得分范围在-1（极负面）到1（极正面）之间，通常可以根据这个得分对用户评论进行分类。以下是一个使用SentimentInten
AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.1-大模型发展历程之背景与开端） shiter AI重制版】人工智能系统解决方案与技术架构人工智能 AIGC 深度学习
文章大纲按照目标不同，AI大模型可分为四类，多模态为未来方向NLP大模型CV大模型科学计算大模型多模态大模型2022年是大模型技术的拐点,前期技术铺垫奠定了基础生成式模型的开端VAE与GANVAEGAN参考文献与学习路径GPT系列模型解析前序文章模型进化券商研报陆奇演讲按照目标不同，AI大模型可分为四类，多模态为未来方向NLP大模型自然语言处理（NaturalLanguageProcessing，
构建未来：基于Spring Boot与Spring Cloud的Java微服务之旅胡蓓怡
构建未来：基于SpringBoot与SpringCloud的Java微服务之旅java-microservices-examplesJavaMicroservices:SpringBoot,SpringCloud,JHipster,SpringCloudConfig,andSpringCloudGateway项目地址:https://gitcode.com/gh_mirrors/jav/java-
【论文阅读】LayoutPrompter: Awaken the Design Ability of Large Language Models 进击的乔洋论文阅读语言模型人工智能
LayoutPrompter:AwakentheDesignAbilityofLargeLanguageModelsabstract条件图形布局生成是一种自动将用户约束映射为高质量布局的技术，目前受到了广泛关注。尽管最近的工作取得了很好的性能，但缺乏通用性和数据效率阻碍了它们的实际应用。本文提出Layout-Prompter，利用大型语言模型(llm)通过上下文学习来解决上述问题。LayoutPr
论文阅读方法某风吾起 work 哲学与人生论文阅读
文章目录步骤一：对论文进行自我判断阅读题目和关键词。阅读摘要阅读总结要点步骤二：阅读文章阅读图表和图表的注释阅读引言阅读实验部分阅读结果和作者对结果的讨论（创新点）要点步骤三：精度论文回答问题1回答问题2回答问题3要点步骤一：对论文进行自我判断阅读题目和关键词。观察这些关键词是否与你的研究的内容有关。如果不相干，可以随时停止，换篇文章看。阅读摘要摘要一般包含了整篇文章的主要内容，是非常非常重要的部
【LAMMPS学习】八、基础知识(3.4)温度计算北行黄金橘 LAMMPS学习学习科学研究 lammps 多尺度模拟科技
8.基础知识此部分描述了如何使用LAMMPS为用户和开发人员执行各种任务。术语表页面还列出了MD术语，以及相应LAMMPS手册页的链接。LAMMPS源代码分发的examples目录中包含的示例输入脚本以及示例脚本页面上突出显示的示例输入脚本还展示了如何设置和运行各种模拟。8.1.通用基础知识8.2.设置入门8.3.分析入门8.3.1.LAMMPS的输出（thermo,dumps,computes,
GAN开山之作--Generative Adversarial Nets 星空彡深度学习机器学习神经网络
GAN开山之作–GenerativeAdversarialNets最近对GAN比较有兴趣，所以开个坑记录一下读论文学习的知识。这是本专栏的第一篇论文，所以笔者认为解析GAN的开山之作——GenerativeAdversarialNets[1]是非常有必要的。有关数学推导部分本文借鉴了深度之眼的b站发布的视频[2]。本文并不是逐字翻译，主要是写笔者对这篇论文的见解思考，其中难免会有错的地方，欢迎讨论
Python 自然语言处理实战： NLTK 与 spaCy，文本分析的左右护法清水白石008 python Python题库 python 自然语言处理 easyui
Python自然语言处理实战：NLTK与spaCy，文本分析的左右护法引言在信息爆炸的时代，文本数据以前所未有的速度增长，蕴藏着巨大的信息和价值。从社交媒体的评论，到浩如烟海的文档，文本数据无处不在，成为了解用户意图、挖掘商业情报、洞察社会趋势的关键来源。然而，文本数据本质上是非结构化的，计算机难以直接理解和处理。自然语言处理(NaturalLanguageProcessing,NLP)技术应运而
论文阅读：Recipe for a General, Powerful, Scalable Graph Transformer 不会&编程图神经网络论文阅读论文阅读 transformer 深度学习图神经网络人工智能
RecipeforaGeneral,Powerful,ScalableGraphTransformer论文和代码地址1介绍与贡献2GPS模型2.1模型框架图2.2PE和SE2.3GPSlayer:一种MPNN+Transformer的混合模型GraphTransformer)论文和代码地址论文地址：https://arxiv.org/pdf/2205.12454v4代码地址：https://git
为啥图片会模糊，canvas显示优化
图片的原始尺寸，就是图片原始的拍摄或者生成出来的大小naturalWidth,原始宽度naturalHeight,原始高度样式尺寸img标签上的width，height缩放倍率，受浏览器缩放影响大小，跟操作系统设置也有关系，反正最后就是个值window.devicePixelRatio清晰度高满足如下公式原始尺寸=样式尺寸*缩放倍率画一个canvas来试试/*样式尺寸*/.canvas{width
llama-factory生成Meta-Llama-3-8B-Instruct模型api服务码不动了鸭 llama 人工智能 transformer
使用llama-factory完成模型的微调训练后，需要开启其api服务进行调用，参考官方https://github.com/hiyouga/LLaMA-Factory/blob/main/examples/inference/llama3_lora_sft.yaml中的内容进行改写API实现的标准是参考了OpenAI的相关接口协议，基于uvicorn服务框架进行开发，使用如下的方式启动：下述为
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST