是Yu欸

21Discrete Adversarial Attack（DaK）攻击——针对语义依附代码模型的对抗攻击方法：Destroyer篡改输入程序，Finder寻找关键特征，Merger将关键特征注入

Discrete Adversarial Attack to Models of Code

写在最前面
- 一些对关系抽取和事件抽取相关的启发和思考
- 摘要
- 总结与展望
- 课堂讨论
研究背景与意义
- 对抗攻击
- 针对代码模型的对抗攻击
- Semantic-adhering语义依附的代码模型
- 针对Semantic-adhering的对抗攻击
- Dak的意义
- 主要贡献
研究内容与方案
- 形式化定义
- DaK的工作流程
- - Destroyer
  - Finder
  - Merger
- 针对DaK的防御
实验结果
- 实验设置
- 实验结果—攻击效率
- 实验结果—对抗样例生成时间
- 实验结果—deadcode检测
- 实验结果—消融实验
- 实验结果—EverI的防御表现
- 实验结果—EverI的训练时间

写在最前面

本文为邹德清教授的《网络安全专题》课堂笔记系列的文章，本次专题主题为大模型。

陈苏宁同学分享了Discrete Adversarial Attack to Models of Code《对代码模型的离散对抗性攻击》
PPT很清爽接受起来比较顺畅

论文发布在：PLDI 2023（Programming Language Design and Implementation）计算机科学领域的顶级会议之一
《ACM Journals》Proceedings of the ACM on Programming Languages
这篇论文的主要内容为针对代码模型的离散对抗攻击（Discrete Adversarial Attack，Dak）

Dak：一种特殊的网络攻击方法，旨在通过对代码进行细微修改，欺骗代码分析模型，而这些修改不改变代码的原始意图或功能。

其主要贡献包括：提出了该攻击方法，证明了对抗性训练可以有效防御该攻击，以及进行了相关的实验评估。

在论文中，研究人员首先形式化了离散对抗攻击的定义，然后介绍了攻击方法的工作流程，包括Destroyer、Finder和Merger三个关键组成部分。Destroyer负责篡改输入程序，Finder寻找关键特征，而Merger将关键特征注入到篡改后的程序中以生成对抗样例。论文还提出了防御方法，其中包括基于之前研究的方法和增强的对抗训练方法（EverI）。

实验结果显示，该攻击方法在离散对抗样例生成方面表现出色，但时间成本可能较高。对抗性训练方法对抵御离散对抗攻击效果显著，而增强的对抗训练方法在防御各种对抗攻击中表现最佳。

如果您对更详细的内容感兴趣，可以通过以下链接访问完整的论文：Discrete Adversarial Attack to Models of Code。

一些对关系抽取和事件抽取相关的启发和思考

这篇论文主要集中在代码模型的离散对抗性攻击上，这篇文章提出了几个关键点，我们可以进一步探讨这些思路：

特征的重要性：
- 在代码模型的离散对抗性攻击中，Finder和Merger的作用体现了关键特征在攻击过程中的重要性。
- 对于关系抽取和事件抽取任务，这启发我们重视关键特征的识别和利用。例如，在处理文本数据时，强化模型对关键实体、行动和关系的识别能力，可以提高模型的准确性和鲁棒性。
防御方法：
- 文章中的对抗性训练方法凸显了提高模型鲁棒性的重要性。
- 在关系抽取和事件抽取领域，这意味着我们可以通过对抗性训练来提高模型对噪声、歧义或故意曲解的输入的抵抗力。这种训练可以让模型在面对复杂或误导性信息时仍能准确提取关系和事件。
泛化能力：
- 语义依附的代码模型需要具备处理多种不同代码输入的能力。
- 对于关系抽取和事件抽取模型，这强调了模型需要有足够的泛化能力来处理各种文本和语境。模型不仅要识别标准场景中的关系和事件，还要能适应语言变化和非标准用法。
创新性思路：
- 文章中关键特征定义和对抗性训练的应用都是理论上的创新。
应用前景：
- 从安全性的角度来看，了解如何保护这些系统免受对抗性攻击，同时确保其准确性和可靠性，对于构建更安全和有效的信息提取系统至关重要。

结合这些思考，可以进一步改进关系抽取和事件抽取技术，使其更加精确、鲁棒和适用于各种应用场景。

摘要

近年来，深度神经网络无处不在的脆弱性引起了人们的极大关注。有趣的是，存在对抗性示例在不引起人类察觉的情况下欺骗最先进的神经模型，导致错误的预测。
在这篇文章中，研究了一种特定于代码模型的不同类型的对抗性示例，称为离散对抗性示例（Discrete Adversarial Attack），这些攻击示例是通过在保持原始输入的语义的情况下对程序进行变换而创建的。
特别是，我们提出了一种新颖的通用方法，该方法在攻击广泛的代码模型方面非常有效。从防御的角度来看，我们的主要贡献是应用对抗性训练（训练鲁棒分类器的最成功算法）来保护代码模型免受离散对抗性攻击的理论基础。在理论结果的激励下，我们提出了对抗性训练的简单实现，这大大提高了代码模型在实践中对抗对抗性攻击的鲁棒性。
我们广泛评估了我们的攻击和防御方法。结果表明，无论防御机制是否到位，我们的离散攻击都比最先进的防御机制更有效，以帮助模型抵抗攻击。此外，我们实现的对抗性训练提高了所有评估模型的鲁棒性，以最大的优势抵御最先进的对抗性攻击以及我们自己的攻击。

总结与展望

总结：
提出了一种针对代码模型的离散对抗攻击（DaK）
证明了应用对抗训练来防御离散对抗攻击（DaK）的理论基础
通过实验评估了提出的攻击和防御方法的表现。结果表明：
1）无论是否有防御技术的存在，DaK的表现均优于现有的攻击方法；
2）增强的对抗训练方法在防御现有攻击方法和DaK攻击时都是最有效的
缺陷：
生成对抗样例和训练网络的时间成本大幅度提升，可能不适用于大模型。

课堂讨论

攻击方法的优势
思路创新性：关键特征的定义、
理论上的创新

研究背景与意义

对抗攻击

深度学习在图像分类、自然语言处理等众多领域展现出了最先进的表现，但同时，也展现了面对对抗攻击的脆弱性，仅仅是难以察觉的微小变化，也能扰乱最优秀的神经网络的结果。

对抗性攻击可以类比为，在一封信中故意加入易误解的信息，使得阅读者理解错误，但不改变整体的内容。

针对代码模型的对抗攻击

利用同样的思想，
本文探讨了一种名为“离散对抗攻击（Discrete Adversarial Attack, DaK）”的攻击方法，旨在针对高级语言程序代码（如Java、C#等）进行对抗攻击。这种攻击方法通过对程序进行变换生成对抗样本，同时保持原始输入的语义不变。

DaK攻击是一种专门针对代码模型的对抗攻击方法。它通过对输入的代码进行离散的变换，生成对抗样本，这些样本在语义上保持不变，但能够欺骗模型。
攻击者利用DaK攻击可以在不改变代码的功能的情况下引入错误或漏洞，从而对代码模型进行攻击。

Semantic-adhering语义依附的代码模型

我们定义语义依附（Semantic-adhering）的代码模型为具有以下特性：
如果一个属性对于程序p以及所有在语义上等同于p的程序的计算方式都相同，那么该属性就被认为是语义依附的。

语义依附的代码模型应具备以下原则：
1、对于等效的语义，模型的输出应保持一致性。
2、对于对抗样本的输入，模型应具备较高的鲁棒性，不易受到攻击的影响。
3、模型应具备一定的泛化能力，能够处理多种不同的代码输入。

设计语义依附的代码模型需要考虑代码的结构、语法和语义信息。一些方法和技巧包括：
1、使用静态分析技术来理解代码的语义结构。
2、引入代码规范和约束，以限制代码变换的范围。
3、利用自然语言处理技术来处理代码中的注释和文档信息，以提取额外的语义信息。

针对Semantic-adhering的对抗攻击

离散对抗攻击discrete adversarial attack（DaK）攻击是一种专门针对语义依附的代码模型的对抗攻击方法。它通过对输入的代码进行离散的变换生成对抗样本，这些样本在语义上保持不变，但能够欺骗模型。攻击者可以利用DaK攻击在不改变代码的功能的情况下引入错误或漏洞，从而对代码模型进行攻击。

黑盒攻击
定向攻击

方法：找到一个语义等价于程序 p 的对抗样本 ̂，使得模型对 ̂的预测结果和p不一样。
由于是 ̂ 由 p 通过保留语义的变换得到的，所以其真实标签（ground-truth label）是确定的。

Dak的意义

越来越多基于学习的漏洞检测器被集成到开发流程中，检测器，尤其是在面对对抗攻击时的正确性和可靠性是取得成功的关键因素。DaK成功使GGNN[1]在变量误用的任务上漏掉了代码漏洞。

[1] Yujia Li, Richard Zemel, Marc Brockschmidt, and Daniel Tarlow. 2016. Gated Graph Sequence Neural Networks. In Proceedings ofICLR’16.

原始输入

对抗样例

引发缓冲区溢出
开源项目绕过检测提交有缺陷代码
在不修改语义的情况下，绕过恶意代码检测

主要贡献

本文的主要贡献包括：

提出了一种针对语义依附的代码模型的离散对抗攻击（DaK）方法。
证明了应用对抗性训练来防御离散对抗攻击的理论基础。
在实验中评估了提出的攻击和防御方法，结果表明：
1. 无论是否存在防御机制，DaK攻击的效果都优于现有的攻击方法。
2. 增强的对抗训练方法在防御现有攻击方法和DaK攻击时都表现最佳。

研究内容与方案

形式化定义

对于原始输入p，对抗样例 ̂ 满足：

由p通过代码变换得到
变换后代码语义不变
变换后的代码预测变成指定的标签 ̂ ，而不是原始输入的标签c。

DaK的工作流程

DaK攻击主要由三部分组成：

Destroyer（破坏者）：对于一个原始输入程序，通过篡改它的特征，削弱模型赖以做出预测的信号。文章选择通过保留语义的变换，篡改整个输入程序。
Finder（寻找者）：针对目标标签，找到一组模型预测结果为目标标签的程序（以下称supplier供应商）。找到每个supplier供应商的关键特征，将这些特征作为最强、最集中的特征。
Merger（合并者）：将供应商的关键特征注入被篡改的程序中，以生成离散的对抗示例。因为供应商的关键特征是强大的、集中的特征，可能会压倒被篡改程序中的剩余特征，所以模型应该预测离散对抗性示例的目标标签。

Destroyer

在破坏原有特征时，对原有标签的预测概率会下降，但同时会带来新的问题——模型预测为其他标签的概率可能会显著提高。

关键思想：只有当所有预测标签的标准差变小时，才应用变换。这可以防止篡改后，模型仍然高度自信地预测为原始标签。

在对程序进行变换后，预测为total的概率仍很高。说明仍存在我们无法克服的显著特征。
灰色的表示关键特征

贪心算法，局部最优

Finder

参考文献[1]的方法，定义关键特征必须满足两个特性：
模型对关键特征的预测和对原始程序预测相同
模型对去掉关键特征后的程序预测结果与原始程序的预测不同

[1] Yu Wang, Ke Wang, and Linzhang Wang. 2021. WheaCha: A Method for Explaining the Predictions of Code Summarization Models.

一个supplier供应商样例

图5.a图是一个原始输入程序，b图是关键特征，c图是去掉关键特征后的代码段

收集一组supllier，只要有任何一个生成了成功的对抗样例，目的就可以达到。

基于文献[1]的方法，定义关键特征 ̃：
1）constituent：是原始程序 p 的一部分；
2）sufficient：代码模型对 ̃的预测结果与对 p 的预测结果相同；
3）necessary：代码模型对 p 去掉 ̃后的部分预测结果与对 p 的不同；
4）1-minimal：去掉 ̃的任何字符，都会破坏2）和3）的特性。

[1] Yu Wang, Ke Wang, and Linzhang Wang. 2021. WheaCha: A Method for Explaining the Predictions of Code Summarization Models.

Merger

将Finder得到的关键特征作为死代码插入到通过Destroyer破坏后的代码段中，根据关键特征的强度进行排序，然后生成对抗样例。

Ranking Suppliers：根据关键特征的强度对supplier进行排序。
1）模型预测目标标签的概率
2）去掉关键特征前后，模型对目标标签预测的概率的差值
两者越大，说明关键特征的效果越强大
采用两者之和进行排序，对每一个supplier生成对抗样例

如右图所示，按照Ranking Suppliers的排序，使用每个suppliers生成对抗样例：
1）将关键特征插入到永远不会执行的分支（switch，if等）中
2）构造普遍（不会被识别为明显异常的代码）且非易见（足够复杂以通过编译器）的分支或循环条件。
如，两个数自乘小于零；Min函数的返回值大于其任意参数

针对DaK的防御

1、首先证明[1]的方法在离散对抗样例下同样适用。
2、提出Enhanced Adversarial TraIning（EverI）方法，原则上适用于所有对抗攻击的防御，主要思想是只在最强的对抗样例上训练一个模型。

对于DaK攻击，首先根据变换在原始输入上构建一个传递闭包，在传递闭包中的所有程序中找出最强大（达到模型最大损失）的对抗样例。
对于其他经典的连续的攻击，通过增加对抗步骤与随机初始化对抗扰动来找出最强的对抗样例。
对于其他离散的攻击，通过增加程序变换搜索树的宽度和深度找出最强的对抗样例。

makes the assumption on the continuous dierentiability of the adversarial loss w.r.t. network parameters as
well as adversarial perturbations, which clearly does not hold for discrete adversaries.

[1] Aleksander Madry, Aleksandar Makelov, Ludwig Schmidt, Dimitris Tsipras, and Adrian Vladu. 2018. Towards Deep Learning Models Resistant to Adversarial Attacks. In International Conference on Learning Representations. https://openreview.net/forum?id=rJzIBfZAb

实验结果

实验设置

实验目的：
1）DaK对（不）存在防御机制的模型的攻击效果；
2）EverI在DaK与最先进的攻击方法下的防御效果。

评分标准：鲁棒性分数被定义为输入程序的正确label没有被变为攻击者的期望label的百分比。
评分越低，说明模型鲁棒性越强；
评分越高，说明攻击越有效。

实验结果—攻击效率

DaK、DAMP、Imitator在code2vec、GGNN、CodeBERT上的表现

平均鲁棒分数，攻击code2vec时，Dak是DAMP的十倍，攻击GGNN时是3倍
Dak容易超过baseline的原因是，
1、DAMP只探索非常有限的解空间，不容易寻找最强大的对抗样例；
2、Imitator本质上是启发式的，不如Dak智能

实验结果—对抗样例生成时间

DaK、DAMP、Imitator在code2vec、GGNN、CodeBERT上生成成功对抗样例的平均时间

实验结果—deadcode检测

Linters/Compilers 的deadcode检测

实验结果—消融实验

实验结果—EverI的防御表现

1、多个变量被重命名，难以检测哪个变量是真正的异常值
2、异常值检测无法处理重命名以外的变换

实验结果—EverI的训练时间

Spring 中的 Bean 作用域(Scope)有哪些？各自适用于什么场景？
面试考察重点Spring框架核心概念的理解深度Bean生命周期管理机制的掌握不同作用域的适用场景判断能力Web环境与非Web环境的差异认知Spring配置与使用的实际经验粉丝福利！需要全套2025最新Java面试笔记的【点击此处即可】即可免费获取！面试核心知识点详解Spring提供的标准作用域：singleton(单例)：默认作用域每个SpringIoC容器只存在一个Bean实例所有对该Bean的
实训任务一：我与新媒体佐智雄
一、自我介绍大家好哦，我是来自湖南商业技师学院的刘某某是一名中职的学生，我喜欢听音乐、画插画，无聊时也会打打游戏，我比较社恐，性格比较内向我对新媒体的认知是通过快手，抖音等网络平台传递信息，新媒体传播速度快，广泛，便捷。而传统媒体指的是报纸、广播、电视等。“新媒体是以数字技术为基础，以网络为载体进行信息传播的媒介”中国的新媒体起源于1994年第一家曙光论坛的创立，兴起于2012年新浪微博的用户爆发
打造智能资讯引擎：基于 Python 的新闻数据爬取与个性化推荐系统实战全流程解析程序员威哥最新爬虫实战项目 python 开发语言
前言：数据时代的信息洪流，如何做到“千人千面”？在信息爆炸的时代，每天都有成千上万条新闻资讯涌现。如何从海量内容中挖掘出用户感兴趣的资讯？这不仅仅是爬虫技术的问题，更是数据建模与智能推荐算法的落地挑战。本篇文章将带你从零出发，构建一个具有实际应用价值的“个性化新闻阅读推荐系统”，从数据采集（爬虫）、文本处理（NLP）、兴趣建模（TF-IDF/协同过滤/Embedding）到推荐展示，覆盖整个推荐系
关于指责文昌许珊珊
今日分享:一直活在自己的感受里，就会忽略别人的感受。多感受别人的感受，是拉进距离的好方式。指责别人时，别人是无力的，自己也是虚弱的，指责的后果要么引来反抗，要么引来漠视，要么引来距离，不仅达不到想要的结果，反而会适得其反。同时，职责也是一种索取。告诉自己，我是宇宙的女儿，我拥有足够的爱和安全感。面对别人的指责，逃避是解决不了问题的，必须强大自己的内心，想解决，要么反抗要么突破，无论选择哪一种，都要
俄罗斯男子甘愿当世界首例活人“换头”手术的志愿者，结果如何三晋风云客
随着科技的进步，人类对各个领域的探索从未停止，医学界亦是。医学家们一直在研究“换头”手术，顾名思义，就是将一个人的头颅移植到另一人的身上去。由于该手术反人类，太过残酷，故被医学界列为禁区。如果这项手术成功，或许会造福人类。因此，医学专家们不断在摸索、尝试“换头”。2016年1月21日，中国科学家为猴子换头成功。哈尔滨医科大学的任晓平成功把猴子的头部与新身体连接血液供应。可惜的是，他没能把两者的脊髓
新月头天的市场行情：养老、消费与科技、大集、短线尝试聚枭
整理于2022.12.1周四天气阴雨今天很冷，室外突降至８度【周四资讯】大盘全天冲高回落，创业板指领涨。盘面上，消费股全线走强，乳业股领涨，熊猫乳品、燕塘乳业、妙可蓝多等近10股涨停，白酒股早盘冲高，中锐股份、口子窖涨停，舍得酒业涨超7%。信创概念股午后反弹，中国软件、吉大正元、英飞拓等涨停。地产股尾盘异动，中国武夷、中交地产均走出6连板。整体上市场热点全天快速轮动，但大多数冲高回落。下跌方面，医
2021年最后一天莲莲
昨晚，没有睡好觉，心里特别不舒服，在瓦房店经历了一年，工作与生活有些喜怒哀乐，有分离与聚合，说不出来的滋味！前几天公公生病，稍有好转，我回到公司，老板约了谈话，说集团模式重组，没有想到，销售的岗位需要调整，因为重新规划的商业重组，如果不改变，企业更难发展，让70后做老师，让90后上场，让更多机会让给90后来做。我还是心里不舒服，很明白这个道理，我们一起努力的朋友，还没有机会舒展自己，我还没有教会他
人生犹如一幅地图拜访春天Anne
首先，通过全面理解对与错、友善与敌意、富有与贫穷、盈与缺、喜与悲、明与暗等分离意识，我们开始熟悉生命与自然的二元特性。其次，我们学会了将分歧和对立融为一体（即合一，我们的真实本质）。有句古谚道“整体大于局部之和”，它道出了一个真相，即我们可以强调部分，但要将整体置于它们之上。在一幅拼图中，就每块拼板单独来看，确实没有什么意义，但一旦将它们放入正确的位置，形成一幅完整的拼图，它们的个体价值瞬间就在整
心安处却难护安稳爱吃辣椒的草莓girl
上课铃响，一个学生一直坐在我的对角线位置，就那样安安静静坐着，不说话也不走动。一边做着课件的我，一边用余光观察着她。心里充满着疑惑。哪个班的呢办公室暂时有三位班主任为什么不去上课呢……看她也没什么动静就暂且不去打扰。康康随手拍过了大概十多分钟，一位妈妈模样的人走了进来，眼神从推开门开始就没离开过那位学生，并径直向她走去。与班主任说了一句半搂着她离开了……很平常的一个叙事，很久不曾也忽视了去记录生活
三亿人都在用的购物app，承包了十亿人的笑点平遥酒
“拼多多，拼多多，拼得多，省得多。拼就要就要拼多多，每天随时随地拼多多，拼多多。”这首歌简直可以与小苹果这样的洗脑神曲相媲美，小编打字的时候都忍不住哼了出来，太羞耻了（捂脸）。“我不生产山寨，我只是山寨的搬运工。”拼多多这个神奇的购物软件总是会强行出现在各种群里，而当听到他在美国上市了，我的心情是这样的：并且脑补出一副这样的宫斗大戏：上市的这一周内，拼多多经历了大起大落，上市后没几天就深陷假货丑闻
Spring Boot整合阿里云OSS：企业级文件存储最佳实践
在云原生时代，文件存储已成为现代应用的刚需。阿里云对象存储OSS作为国内市场份额第一的云存储服务，为开发者提供了安全可靠、高扩展的存储解决方案。本文将深入探讨SpringBoot整合OSS的最佳实践。一、为什么选择阿里云OSS？阿里云OSS在以下场景中展现显著优势：海量数据存储：单Bucket支持EB级存储，轻松应对业务增长高并发访问：支持百万级QPS，满足电商大促等高并发场景成本优化：存储费用低
精时力日志-11 央曰
【第2周实践】这是2018年2月崔律“时间记录app”系列第2周的课后实践。今天是自习打卡第2天。1.我的实践：今天正式返回老家过年。从早上起床，到搭车，到亲戚家吃饭。白天所有的时间都变成“关系类”，吃饭及陪父母玩都没有切换状态，回到家里，我就那样轻易忘记时间记录了。今天的时间记录大块是“睡眠”、“关系”、“交通”。2.实践中的亮点：感觉今天没有亮点。唯一欣慰的是，我还能准时上年前最后一节“一块听
潘卫英焦点解决网络初级19期坚持分享第20天 2019.11.28 紫印
走进心理学（三）在中国，绝大多数人对心理学的认识和了解非常有限，由于弗洛伊德的精神分析学派，在心理学有着非常重要的地位，在讨论心理学和心理学对象的时候，都会提到精神分析，弗洛伊德本人是一名医生，他研究发现精神病人是由于理智与无意识的矛盾激化，造成了神经症和精神分裂。由于在西方社会，精神分析理论相对于心理学其他学派更普及，传播的比较广泛，因此在中国，大部分人认为心理学、心理咨询就是和精神病有关，寻求
你还在用 JSON？Protobuf 才是高效通信的王者！ IsLand1314~ #Protocol Buffers json 数据库 mysql
一、基本特点Protobuf是一个跨平台的协议，具有语言无关的特性。其核心设计目标是高效的数据传输，因此对数据类型的设计尤为关键。ProtoBuf官方文档1.序列化定义：序列化是将数据结构或对象转换成二进制字节流的过程。特点：Protobuf针对不同的字段类型采用不同的编码方式和数据存储方式，以确保得到高效紧凑的数据压缩。序列化过程判断每个字段是否有设置值，有值才进行编码。根据字段标识号与数据类型
LeetCode - 3274. Check if Two Chessboard Squares Have the Same Color 阿蒙Armon LeetCode leetcode 算法职场和发展
LeetCode-3274.CheckifTwoChessboardSquaresHavetheSameColor在LeetCode的算法题库中，有许多有趣的题目将实际场景与编程逻辑相结合，LeetCode3274题CheckifTwoChessboardSquaresHavetheSameColor便是其中之一。这道题以国际象棋棋盘为背景，要求我们判断给定的两个方格颜色是否相同。通过解决这道题，
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1024 一元三次方程求解热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：
《有钱人和你想的不一样》共读第二篇财富档案7 橙澄读书写作
金句分享：1人与积极的成功人士交往。穷人与消极的人或不成功的人交往。（真的有这种感觉，跟对圈子很重要，三观不同的人不宜交往太密，远离那些总是消极、负能量的人）2成功的人会把其他成功的人当做激励自己的动力，把其他的成功人士看成学习对象，告诉自己如果他们做得到，我也可以。3模仿，是人最主要的学习方式。4有钱人会感谢在他们之前就已经成功的人，因为他们提供了模范供人追随，让别人比较容易获得成功。5你的目标
2018-12-13 1bdb7fe682ab
姓名:周贤文常州新日催化剂有限公司【日精进打卡第63天】【知～学习】1.《六项精进》1遍共94遍1.《大学》1遍共93遍【经典名句分享】创新的秘密在于知道如何把你的智谋藏而不露。——爱因斯坦喜欢(566)加入句集评论(2)浅浅梦分享人类的创新之举是极其困难的，因此便把已有的形式视为神圣的遗产。——蒙森【行～实践】一、修身：听音乐二、齐家：洗衣服【省～觉悟】说那么多干嘛，干就完了｛积善｝：从2018
Python FastAPI 与传统 Web 框架的性能对比 Python编程之道 python fastapi 前端 ai
PythonFastAPI与传统Web框架的性能对比关键词：FastAPI、性能对比、Web框架、异步编程、Python、Django、Flask摘要：本文深入探讨了FastAPI与传统PythonWeb框架（如Django和Flask）在性能方面的差异。我们将从架构设计、请求处理模型、并发能力等多个维度进行对比分析，并通过基准测试数据展示实际性能差异。文章还将提供代码示例和性能优化建议，帮助开发
Python Scrapy爬取办公用品网站数据的策略 Python编程之道 python scrapy 开发语言 ai
1.引入与连接想象一下，你是一家办公用品公司的市场调研人员，需要了解竞争对手的产品价格、种类等信息。如果手动去各个办公用品网站收集这些数据，那将是一项极其繁琐且耗时的工作。而Python的Scrapy框架就像是一个不知疲倦的超级助手，能帮你快速、高效地从众多网站抓取所需数据。你可能已经对Python有了一定的了解，知道它是一门功能强大且应用广泛的编程语言。Scrapy则是Python中专门用于网络
使用Python Scrapy打造个性化爬虫
使用PythonScrapy打造个性化爬虫——知识金字塔构建1.引入与连接：从“手动复制”到“自动化采集”的跨越你是否遇到过这样的场景？想整理1000条知乎优质回答做数据分析，却要逐条复制；想追踪某电商平台的商品价格波动，却要每天手动刷新页面……这些重复劳动，正是“个性化爬虫”的用武之地！与已有知识的连接：你可能用过requests+BeautifulSoup写过简单爬虫，但面对大规模数据、复杂反
公开发言：如何管理好听众的注意力？溜溜咻咻
要想牢牢地抓住听众的注意力，这个发言稿不能展现复杂的书面逻辑，咱们得营造听众的感受模型框架：挑战+解决方案重要公式：公开发言=一个挑战+三点方案+一次返场。一个挑战❤️开场白只要是实现一个目标：建立跟台下观众的连接感❤️开头设置一个挑战：挑战首先它得是一个问句。也就是说，一开始你要告诉观众今天我们来解决一个什么样的问题。❤️开头第一句话：把原来的陈述句改成一个问句❤️好的挑战是“与你有关，让你喜欢
2023-03-19 我_4b6f
保定影像之街道（一一三九）2019年1月26日，星期六。农历戊戌年乙丑月癸亥日（狗年）十二月（腊月）二十一。河北省保定市：五四路。保定市，古称清苑、上谷、保州、保府。因城池似靴，又称靴城。保定与北京相伴而生，保定之名取自“保卫大都、安定天下”之意。五四路，东西街道。五四路始建时，因其东端与青年路相接，关联命名为五四路（五四青年节）。2003年5月21日，国务院办公厅批准修订后的《保定市城市总体规划
TensorFlow GPU 2.10.1 for Python 3.9快速安装指南疑样
本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
什么是辩证法：是对话，是不计结论的对谈、是诚实与善意的沟通单华伟
这是单华伟的第一百五十七篇原创文章|辩证法就是对话当赫拉克利特说出『人不能两次踏入同一条河流』的时候，辩证法在哲学上便真正开始了，但这还是一种比较朴素的自然辩证法，用大家都很熟悉的一句话来说，那就是：强调万事万物相互统一，对立转化的一面。而真正将辩证法发展成一种系统的方法论，并且实践得最好的，非苏格拉底莫属，而辩证法在他那里，用两个字就可以概括，那便是『对话』。实际上，辩证法（dialectics
linux下修改文件及保存的命令 ananRunner
进入vi的命令vifilename打开或新建文件，并将光标置于第一行首vinfilename打开文件，并将光标置于第n行首vi/patternfilename打开文件，并将光标置于第一个与pattern匹配的串处vi-rfilename在上次正用vi编辑时发生系统崩溃，恢复filenamevifilename.....filename打开多个文件，依次进行编辑插入文本类命令i在光标前l在当前行首a
进阶向:基于Python的智能客服系统设计与实现
智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
实际上高仿积家手表一般多少钱一块（精仿积家售价一览表）星耀腕表
积家手表作为世界著名的高端手表品牌，深受消费者喜爱。然而，高昂的价格让许多消费者望而却步。于是，市场上出现了各种高仿积家手表。那么，这些高仿积家手表的价格是多少呢？本文将为您揭秘。高仿积家手表的价格因其品质、材质和工艺的不同而有所差异。一般来说，价格从几百元到几千元不等。其中，价位在1000元以下的高仿积家手表多为质量较低的仿品手表，选用的是低廉的材质和简陋的工艺，不仅在美观上与正品相差甚远，而且
姜子牙不凡的一生溯源清流
姜子牙本姓姜，名尚，字子牙，他的祖先曾受封于“吕”地，故又名“吕尚”。他是西周的开国元勋、齐文化的创始人，亦是一位韬略家、军事家与政治家。儒、道、法、兵、纵横诸家皆将他视为本家人物，故被尊为“百家宗师”。穷困潦倒姜子牙未辅佐周文王前，生活十分潦倒、坎坷多磨。三十二岁时，因为商朝战争不断，他为了躲避战祸，跑到山上修道，经过四十年的苦修，直到七十二岁才出山。出山后，因为年纪大又没有一技之长，只好暂时投
三好一改 2019年11月13日 1575期 8f9514241cc4
1好：客户信任今次陌生拜访客户，到达客户店面，进行了初步的沟通，向客户介绍了产品，客户对产品有兴趣，也了解到公司的基本情况。谈到付款情况时，出现了差异，客户要求货到付款，公司的财务制度是先款后货。财务又是不可协调的，与客户只能先保持联系，在合适的时机与客户合作。客户的反馈是非常正常的，一个陌生人到了店里，跟客户说有哪些产品，信任根本没有建立起来，又怎么会直接打款发货呢？万一被骗了呢？从自身来说，没
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文