是Yu欸

23REPEAT方法：软工顶会ICSE ‘23 大模型在代码智能领域持续学习代表性样本重放（选择信息丰富且多样化的示例） + 基于可塑权重巩固EWC的自适应参数正则化【网安AIGC专题11.22】

Keeping Pace with Ever-Increasing Data:Towards Continual Learning of Code Intelligence Models

写在最前面
论文名片
nlp中的命名实体识别NER和关系抽取任务RE的启发
课堂讨论
- 噪声数据排除
- 基于可塑权重巩固EWC的自适应参数正则化
- 代码克隆检测准确率比较低
绪论
- 代码生成大模型
- - PPT学习，连贯动画感（方框是后期添加的）
研究方法与思路
- 持续学习
- REPEAT方法整体方案
- 代表性样本重放
- 可塑权重巩固（EWC)
- - 基于可塑权重巩固（EWC)的自适应参数正则化
实验方案与结果
- 数据集
- 实验设置
- 基线对比
- 泛化能力
- - `为什么漏洞检测和代码克隆任务上的准确率这么低`？
- 消融实验
创新和贡献

写在最前面

本文为邹德清教授的《网络安全专题》课堂笔记系列的文章，本次专题主题为大模型。

黄邕灵同学@potato&&tomato:分享了Keeping Pace with Ever-Increasing Data:Towards Continual Learning of Code Intelligence Models《跟上不断增长的数据:迈向代码智能模型的持续学习》
软工顶会ICSE ‘23: Proceedings of the 45th International Conference on Software Engineering

论文主题：大模型在代码智能领域的应用，特别是它们如何持续学习并适应新数据。

将论文阐述得深入浅出，受益匪浅
这门课中最细节的PPT，对公式的每个符号都进行了解释，观感特别友好

论文：https://arxiv.org/pdf/2303.16749.pdf

论文名片

代码智能模型在持续学习环境中面临的挑战，特别是如何使这些模型能够从不断增长的数据集中学习而不会忘记旧知识。这种学习的难点在于防止所谓的“灾难性遗忘”，即模型在学习新数据时遗忘旧数据的情况。

以往的代码智能研究通常以离线方式在固定数据集上训练深度学习模型。然而，在实际场景中，新的代码仓库不断涌现，所携带的新知识有利于向开发者提供最新的代码智能服务。
在本文中，我们针对以下问题：如何使代码智能模型能够从不断增长的数据中不断学习？这里的一个主要挑战是灾难性的遗忘，这意味着模型在从新数据集学习时很容易忘记从以前的数据集中学习的知识。

提出了REPEAT的新方法，该方法结合了代表性示例重放、自适应参数正则化来解决灾难性遗忘问题。
通过这种方式，模型能够保留重要的旧知识，同时也学习新数据集提供的新知识。

为了应对这一挑战，我们提出了REPEAT，这是一种持续学习代码智能模型的新方法。具体来说，REPEAT通过代表性示例重放、自适应参数正则化解决了灾难性的遗忘问题。
代表性示例重放组件在每个数据集中选择信息丰富且多样化的示例，并使用它们定期重新训练模型。
自适应参数正则化组件可识别模型中的重要参数，并自适应地惩罚其更改，以保留之前学习的知识。

REPEAT方法在提高模型对新数据的适应性的同时，有效地减轻了灾难性遗忘问题。

我们在三个代码智能任务上评估了所提出的方法，包括代码摘要、软件漏洞检测和代码克隆检测。大量实验表明，REPEAT在所有任务上的表现始终优于基线方法。例如，REPEAT在代码汇总、漏洞检测和克隆检测方面分别将传统的微调方法提高了1.22、5.61和1.72。

nlp中的命名实体识别NER和关系抽取任务RE的启发

REPEAT方法提供了一系列值得借鉴的概念和技术，这些可以应用于NLP中的NER和关系抽取任务，以改进模型的持续学习能力、泛化能力和准确性。

持续学习
- 适应性：NLP系统需要能够适应语言的持续变化，如新词汇、新的命名实体或新的语言用法。REPEAT方法中的持续学习，涉及处理新兴词汇和不断变化的语料。
- 数据多样性：REPEAT方法中对数据多样性的关注，提示了对不同领域和语言风格的文本进行训练的重要性。
灾难性遗忘的处理
- 模型泛化：在NER和关系抽取中，模型在接触新数据时也面临着灾难性遗忘的问题。REPEAT方法通过保持重要信息的、同时学习新信息的策略提供了思路。
- 参数正则化：REPEAT使用的自适应参数正则化可以被用于调整模型中参数的更新，以维持对旧知识的记忆。
代表性样本的重要性
- 数据选择：REPEAT方法中代表性示例重放的概念，可用于优化NER和关系抽取任务的数据选择，即选择那些能够提供最大信息量的样本进行训练。
- 减少过拟合：选择多样化且信息丰富的样本可以帮助模型更好地泛化，减少对特定数据集的过拟合。
多任务的应用与评估
- 跨任务学习：REPEAT方法展示了在多个任务上成功应用一个统一方法的可能性，即可以探索在不同但相关的NLP任务上应用统一的持续学习策略。
- 多任务评估：REPEAT方法在多个任务上的评估展示了进行综合性能评估，在多个层面和多个标准上评估模型性能。

课堂讨论

噪声数据排除

噪声数据，训练损失比较大
选择训练损失更小的样本

三个不同任务，用到了三个数据集
数据集划分成了五个子数据集
特征差别不大

基于可塑权重巩固EWC的自适应参数正则化

旧模型训练好的参数，新模型上再次训练
重要参数尽可能小的改变：计算每个参数的变化值，限制参数变化

代码克隆检测准确率比较低

大模型结构不太一样，
codebert基于编码器，在第一个任务上更擅长
T5的摘要更合适

REPEAT方法在漏洞检测和代码克隆任务上准确率较低可能是由几个因素造成的，了解这些因素有助于进一步优化REPEAT方法，或开发更适合这些特定任务的新方法：

任务本身的难度：漏洞检测和代码克隆是代码智能领域中比较复杂的任务。它们需要模型对代码的深层结构和潜在的安全漏洞有很高的理解能力。这些任务往往涉及对细微差别的识别，比如在代码克隆检测中区分微妙的代码差异、或者在漏洞检测中识别潜在的安全风险。
数据集的质量和多样性：如果用于训练和测试模型的数据集不够丰富或者质量不高，模型的性能可能会受到影响。在漏洞检测和代码克隆任务中，高质量、多样化的数据集对于训练有效的模型至关重要。
模型的泛化能力：这些任务可能要求模型在不同的编程语言和代码库中具有较好的泛化能力。如果模型在训练过程中未能充分学习到可以泛化到新情况的特征，其性能可能会降低。
灾难性遗忘的挑战：尽管REPEAT方法旨在减轻灾难性遗忘问题，但在实际应用中，完全避免模型在学习新任务时忘记旧任务的知识仍然是一个挑战。特别是在复杂任务如漏洞检测和代码克隆中，保持之前学习成果的难度可能更大。
特定任务的特性：每个代码智能任务都有其独特的特性和挑战。REPEAT方法虽然是一个通用的持续学习方法，但它可能不完全适用于某些特定任务的特定需求。

绪论

代码生成大模型

大模型是一种复杂的计算机程序，它可以学习和适应新信息。在软件开发领域，这些模型帮助自动化许多任务，比如：

◆ 文本生成代码
根据自然语言描述生成代码
◆ 代码摘要
以自然语言描述生成源代码摘要
◆ 代码翻译
将一种编程语言编写的代码转换为另一种同功能编程语言的过程
◆ 代码漏洞检测
要求 LLM 检测提示中提供的源代码中的缺陷
◆ 代码克隆检测
检测存在于代码库中两个及以上的相同或者相似的源代码片段
◆ 代码重构、代码补全、代码修复、代码搜索…

PPT学习，连贯动画感（方框是后期添加的）

如何维护代码智能模型，使模型能够持续学习，随时间变化的知识，不断更新迭代？

在新数据集上对模型进行微调
灾难性遗忘问题：模型会忘记从以前的数据中学习到的知识、
在所有历史数据集上重新训练模型
该方法可以保持模型的性能，但计算开销大，缺乏可行性
一种新的基于持续学习的方法

研究方法与思路

持续学习

当新的代码不断出现时，模型需要不断学习这些新信息。但这里有一个挑战：当模型学习新信息时，它可能会“忘记”以前学到的内容。这就像我们在学习新语言时可能会忘记之前学过的语言。

基于情景记忆的方法
◼ 基于情景记忆的方法通过保存一些之前任务的样例进行记忆回放来缓解灾难性遗忘，这些样本/伪样本既可用于联合训练，也可用于约束新任务损失的优化，以避免干扰先前任务。
基于正则化的方法
◼ 通过为损失增添额外损失项，对权重进行约束，保护巩固已学习的知识，但这样可能会制衡新任务的学习性能，无法很好的权衡新旧任务。该类方法不需要保存任何以前的数据，只需要对每个任务进行一次训练。但是，随着任务数量的不断增加，可能导致特征漂移现象。
基于动态结构的方法
◼ 动态的对网络结构进行调整，使其适应新的任务，也可以扩展网络结构来学习新的任务，使用更多的神经元或网络层。然而随着任务数量的不断增多，模型结构会不断变大，因此这样的方法无法应用到大规模数据中，影响其在实际场景中的使用。
另外，该类方法也不能从任务之间的正向迁移中获益。

REPEAT方法整体方案

为了解决上述挑战，研究人员提出了一个称为“REPEAT”的新方法。这个方法通过两个关键步骤来帮助模型更好地学习：

选择性记忆：REPEAT从以前的数据中挑选最有价值的信息，帮助模型记住关键内容。
平衡学习：REPEAT确保在学习新内容的同时，不会丢掉老知识。

针对代码智能数据集中存在各种数据模式和噪声数据的问题，提出一种新的代表性样本重放方法，保留数据集中更具信息量的多样性样本。

考虑到软件开发中存在较多的代码重用，提出了一种基于数据集之间共享知识的自适应参数正则化机制来控制参数更新的程度。

在三个代码智能任务上与两个先进的模型进行了对比，实验结果证明该方法对于缓解灾难性问题具有较好效果。

代表性样本重放

针对样本大小有限，如何缓解模型对保存的样本过拟合并忘记其他样本的问题

多样性样本选择
 使用TF-IDF（词频-逆文档频率）算法向量化代码样本
 使用K-means算法将样本划分为K类，从每个类中分别选取样本
信息性样本选择
 噪声数据具有较大的训练损失
 滤除高损失样本，保留具有高信息量的样本数据
样本移除
 确定当前数据集中的代表性样本后，从先前的数据集中移除相应数量样本，以保持数据集大小恒定

可塑权重巩固（EWC)

利用重要度矩阵，即： Fisher信息矩阵，度量网络参数对旧任务的重要程度；
L2正则化用于在训练新任务B时对完成任务A重要的网络

计算两个数据集之间的相似度，相似度越大，新知识权重越小。
因为旧模型中已经学习到了很多相似的知识

基于可塑权重巩固（EWC)的自适应参数正则化

No penalty
训练完猫狗识别后，模型在猫狗识别的任务上有很不错的表现，此时直接用该模型继续训练狮虎识别模型
学完任务B后将会遗忘任务A
L2正则化
L2正则化倾向于生成更小、更分散的权重向量，鼓励分类器考虑所有输入维数，防止模型过拟合。
L2正则项没有考虑不同参数对任务的重要性
EWC
让模型参数受限地变动，限制对任务A 特别重要的参数，改变非重要参数。参数矩阵里面，某些参数对猫狗识别非常重要，在训练狮虎识别时，记下这些参数原本的值，加一个损失函数阻碍它们的变化，模型在样本空间中，猫狗识别的数据样本区域分类器的超平面变化不大。
通过控制优化方向，使得其能够处于两个区域的交集部分，在旧任务与新任务上都有良好的性能。

实验方案与结果

通过一系列实验，研究人员发现REPEAT方法比旧方法更有效。它不仅帮助模型更好地记住旧信息，还提高了在新任务上的表现。

数据集

代码摘要
CodeSearchNet ，包含 GitHub 上的开源项目的用 Go、Java、 Python等6种语言编写的相关代码和解释文档。
漏洞检测
Big-Vul，由2002年至2019年常见CVE漏洞数据库中超过300个 GitHub 项目中的 C/C++ 代码片段组成。
克隆检测
克隆检测 POJ，包含52,000个C语言代码片段，具有104个功能。

实验设置

预训练模型
◼ CodeBERT： 2020年微软&合工大提出的NL-PL（自然语言-编程语言）双模预训练模型
◼ CodeT5 ： 2021年提出的编码器-解码器模型，它以不同前缀的序列到序列范式表述所有任务，并在各种代码智能任务上实现了最先进的性能。
Baseline
◼ FT：直接针对每个新任务对模型进行微调，持续学习领域的下届基线系统。
◼ EMR ：基于样本重放的方法，使用从以前的任务中随机选择的旧样本重新训练模型。
◼ EWC：采用弹性权重固结来规范参数的变化，每个参数的重要性由Fisher矩阵确定。
◼ Upper：用当前数据集和所有历史数据集的数据训练模型，该方法可以用于提供上届参考
评估指标
代码摘要、漏洞检测/代码克隆、持续学习

基线对比

◼ FT严重患有灾难性遗忘问题
◼ 样本重放和参数正则化有利于缓解灾难性遗忘
◼ REPEAT在不同代码智能任务都有由于其他基线系统的性能

泛化能力

◼ 在前四个数据集上训练所有基线模型和REPEAT，在第五个数据集上评估模型性能
◼ REPEAT-1、 REPEAT-2和REPEAT-3，分别表示在第一、第二和第三个数据集上的训练REPEAT
◼ 使用CodeBERT作为基本模型，并选择Java作为代码汇总的评估数据集。
◼ 用新数据持续训练模型有利于模型在未知项目上的泛化。

`为什么漏洞检测和代码克隆任务上的准确率这么低`？

任务本身的难度：漏洞检测和代码克隆是代码智能领域中比较复杂的任务。它们需要模型对代码的深层结构和潜在的安全漏洞有很高的理解能力。这些任务往往涉及对细微差别的识别，比如在代码克隆检测中区分微妙的代码差异、或者在漏洞检测中识别潜在的安全风险。
数据集的质量和多样性：如果用于训练和测试模型的数据集不够丰富或者质量不高，模型的性能可能会受到影响。在漏洞检测和代码克隆任务中，高质量、多样化的数据集对于训练有效的模型至关重要。
模型的泛化能力：这些任务可能要求模型在不同的编程语言和代码库中具有较好的泛化能力。如果模型在训练过程中未能充分学习到可以泛化到新情况的特征，其性能可能会降低。
灾难性遗忘的挑战：尽管REPEAT方法旨在减轻灾难性遗忘问题，但在实际应用中，完全避免模型在学习新任务时忘记旧任务的知识仍然是一个挑战。特别是在复杂任务如漏洞检测和代码克隆中，保持之前学习成果的难度可能更大。
特定任务的特性：每个代码智能任务都有其独特的特性和挑战。REPEAT方法虽然是一个通用的持续学习方法，但它可能不完全适用于某些特定任务的特定需求。

消融实验

◼ 使用CodeBERT和CodeT5作为我们的基本模型，并选择Java和Python作为代码总结的评估数据集。
◼ REPEAT-C、 REPEAT-L和REPEAT-A，分别表示移除了基于聚类的样本选择，基于损失的样本选择和自适应参数正则化模块后的模型性能。
◼ 删除基于聚类的样本选择会显著降低各类任务的性能。例如，在CodeBERT预训练模型漏洞检测方面的表现在F1、 Precision和Recall方面分别下降了1.99、 1.37和2.16分，表明了样本多样性的重要性。
◼ 删除基于损失的样本选择会显著降低各类任务的性能。例如，在CodeBERT预训练模型代码摘要方面的表现在BLEU-4、 METEOR和ROUGE-L方面分别下降了0.64%、 0.39%和0.48%，表明了去除样本噪声数据的重要性。
◼ 删除自适应参数正则化会显著降低各类任务的性能。在持续学习环境中，自适应惩罚重要参数变化是有效的。

创新和贡献

◼ 第一个在持续学习场景下探索代码智能模型性能的工作。
◼ 为了防止代码智能模型灾难性地遗忘所学知识，提出了一种新的基于持续学习的方法REPEAT，该方法采用了代表性示例重放和自适应参数正则化技术。
◼ 使用两个最先进的模型对三个代码智能任务进行了广泛的实验。实验结果证明了重复记忆的有效性及其减轻灾难性遗忘问题的能力。

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
三大师传 beca酱
巴尔扎克的作品被誉为“法国社会的一面镜子”。文学大师维克多·雨果对巴尔扎克的评价是：“在最伟大的人物中间，巴尔扎克是名列前茅者；在最优秀的人物中间，巴尔扎克是佼佼者之一。”一个原本寂寂无名的小人物，从地中海的某个海岛上，只身一人来到巴黎，没有朋友，也没有名望。作为一个一文不名的外乡人，凭着赤手空拳赢得了巴黎，征服了整个法兰西，并且赢得了世界。这个人就是十九世纪法国伟大的军事家、政治家，法兰西第一帝
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
我的烦恼余建梅
我的烦恼。女儿问我：“你给学生布置什么作文题目？”“《我的烦恼》。”“他们都这么大了，你觉得他们还有烦恼吗？”“有啊！每个人都会有自己烦恼。”“我不相信，大人是没有烦恼的，如果说一定有的话，你的烦恼和我写作业有关，而且是小烦恼。不像我，天天被你说，有这样的妈妈，烦恼是没完没了。”女儿愤愤不平。每个人都会有自己的烦恼，处在上有老下有小的年纪，烦恼多的数不完。想干好工作带好孩子，想孝顺父母又想经营好自
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

23REPEAT方法：软工顶会ICSE ‘23 大模型在代码智能领域持续学习 代表性样本重放（选择信息丰富且多样化的示例） + 基于可塑权重巩固EWC的自适应参数正则化 【网安AIGC专题11.22】