vector<>

【一起入门NLP】中科院自然语言处理第16课-简明扼要：红到发紫的prompt是什么？【上】

前几天自然语言处理课学到了“预训练语言模型”这一章，在最后老师介绍了今年刚刚提出来的Prompt，并强调：这东西现在很火，想发论文的赶紧行动。由于和我的研究方向相关，因此打算对Prompt做一个系统的调研。我们现在开始吧！

目录

从四大范式到Prompt

第一范式：特征工程

第二范式：架构工程

第三范式：目标工程

第四范式：Prompt挖掘工程

举例1.二分类

举例2.多分类

举例3.匹配任务

第三范式与第四范式的关系

Prompt最大的优点：少/零样本

从四大范式到Prompt

在NLP的发展过程中，经历了4大范式，这里的范式不禁让人想起数据库中学到范式，可不要想多了哦，所谓的范式就是指建模方式。

第一范式：特征工程

非神经网络时代的完全监督学习：在概率统计时代，靠人工来进行大量的特征提取，依赖于大量的监督数据。

第二范式：架构工程

基于神经网络的完全监督学习：来到了深度学习时代，实现了自动获取特征来进行端到端的分类，但是仍然需要人工来设计合理的网络结构，模型的性能也依赖于大量数据集

第三范式：目标工程

预训练-精调范式（Pre-train,Fine-tune）：第三范式也是目前正流行的一种建模方式。它分为两个阶段：

第一阶段（Pre-train）：利用大型语料库完成预训练模型的无监督学习。第一阶段的训练结束之后这个语言模型（LM）获得了大量的知识。
第二阶段（Fine-tune）：预训练语言模型之后接上一个下游任务，只需要少量任务数据进行监督学习，微调预训练语言模型，就可以完成这个下游任务。

由于预训练完成之后，这个“博学多才”的语言模型并不是什么都会，所以在fine-tune阶段，最重要的工作是✨：引入一些额外的参数，对这个模型进行微调，让他适应于下游的分类任务。

因为频繁提到了“预训练语言模型”这个词，因此有必要在这里做一个简单的补充。已经理解了的读者可以跳过这一小段～

以Bert为例：
Bert是一个堆叠的双向Transformer Encoder，有自己的输入输出和隐藏层，是一个完整的结构。下面以下图为例说明Bert的训练和预测过程：

训练：输入句子：“武则天是中国第一个女皇帝”，首先将这个输入挖空，处理成“武【mask】天是中国第一个【mask】皇帝”，经过Bert之后输出的是概率分布，对于第一个mask，【则】的概率应该是最大的，对于第二个mask【女】的概率应该是最大的。不断地给Bert喂大量的语料来训练，最后将得到一个非常擅长做完形填空的Bert。需要强调的是，Bert的训练是无监督的，因为输入和标准答案都是句子本身（第一个mask的标准答案“则”，就存在于输入句子中），更严谨的说法是【自监督】，总之，预训练过程不需要对数据进行标注。
预测：模型被训练好了之后，给Bert任意一个句子，比如：“【mask】是中国的首都”,Bert能很快地预测出答案为“北京”。
可以粗糙地把Bert理解为：一位博学多识的完形填空满分选手

在prompt出来之前，预训练思想也被用来解决很多小样本场景的问题。这是因为，获取大量无标签的文本数据相对简单，获取有标签的训练数据相对困难，而预训练方式只需要在第二阶段fine-tune时使用少量的有标签数据就可以达到直接用大规模数据训练的效果。

此处再插播一个冷知识：在很多关于预训练语言模型的论文或者博文中，你是不是经常看到这些动画人物呢？

这些动画人物是《芝麻街》中的角色，这是美国的一档少儿教育节目，还有一系列的动画电影等，是美国人家喻户晓的动画人物了。从左到右依次是：ERNIE，ELMo，BART，BERT。有没有发现华点呢？这正是目前流行的四个语言模型的缩写。

只能说这些科学家们用心良苦。

第四范式：Prompt挖掘工程

预训练，提示，预测范式（pre-train,prompt,predict）：第四范式一经提出就在NLP领域受到了极大的关注，Prompt思想也被认为是一个趋势。
简单来说，prompt 将下游的输入输出形式改造成预训练任务中的形式（重构下游任务）。这里的“改造形式”是什么意思呢？在上文中笔者简介了善于完形填空的Bert，下面我们以Bert为例，举几个Prompt对下游任务进行重构的例子：

举例1.二分类

在原来的模型中，我们这样定义这个分类任务：

目标：对“这个餐厅服务真不错”情感倾向分类
任务输入：这个餐厅的服务真不错
任务输出：任务标签{正向，负向}

在Prompt中，我们把上述任务重构为一个完形填空问题：

Prompt任务输入：____满意，这个餐厅的服务真不错
Prompt任务输出：任务标签{正向，负向}

当然这里需要通过一些手段，限制Bert只能在这个位置预测出“很”或者“不”，另外还需要将“很”对应为正向标签，将“不”定义为负向标签。以上，经过对下游任务的重构，不需要对Bert进行fine-tune即完成了任务。

举例2.多分类

目标：对“滑雪运动员取得了很好的成绩”主题分类
任务输入：“滑雪运动员取得了很好的成绩”
任务输出：任务标签{体育，娱乐，访谈，影视}

将这个任务重构为完形填空问题：

输入：“下面是一则___新闻。滑雪运动员取得了很好的成绩”
输出：任务标签{体育，娱乐，访谈，影视}

与上一个二分类问题不一样，这了的输出{体育，娱乐…}直接就是分类标签，无需再进行输出与标签的映射

举例3.匹配任务

目标：判断这两个句子“我去了北京”跟“我去了上海”是否相容
输出：“我去了北京”+“我去了上海”
输出：任务标签{相容，不相容}

将这个匹配任务重构为

输入：我去了北京？____我去了上海
输出：任务标签{相容，不相容}

同样，Bert填好空之后，需要将“是的”映射为“相容”，将“不是”映射为“不相容”。
通过上面这三个例子，你清楚了Prompt所谓改造下游任务是什么意思了吗？每一个任务都巧妙地改造成了一个完形填空问题，这对我们“完形填空高手Bert”来说，简直是小菜一碟啊。所以，经过这样的改造，直接通过之前训练好的语言模型就可以完成任务，在某些场景下不需要对语言模型进行任何的改动。

第三范式与第四范式的关系

Fine-tuning中：是预训练语言模型“迁就“各种下游任务。具体体现就是通过引入各种辅助任务loss，将其添加到预训练模型中，然后继续pre-training，以便让其更加适配下游任务。总之，这个过程中，预训练语言模型做出了更多的牺牲。
Prompting中，是各种下游任务“迁就“预训练语言模型。我们需要对不同任务进行重构，使得它达到适配预训练语言模型的效果。总之，这个过程中，是下游任务做出了更多的牺牲。

可以看到无论是谁迁就谁，本质上都是预训练模型与下游任务越来越靠近。刘鹏飞博士在知乎回答的最后有这样一段话发人深思：Prompting本身不是目的，它是一种让下游任务和预训练语言模型更加接近的途径，如果我们有其他更好的方式，那就可以引领下一个范式，近代自然语言处理技术的发展史本质上（可能）是下游任务与预训练语言模型关系的变迁史。(膜拜大佬)

Prompt最大的优点：少/零样本

前面我们提到Prompt的思想是重构下游任务来适配预训练语言模型，不需要对预训练语言模型进行任何fine-tune。但是为了达到让“预处理模型与下游任务靠近”的目的，在有条件的情况下，也可以即重构下游任务，又对预处理模型进行fine-tune。（比如在一些应用场景中，可以很轻松得到大量有标注数据以供fine-tune，此时就可以尝试一下除了使用Prompt之外，再微调LM是否能获得更好的效果）
在基于Prompt的下游任务学习中，通常存在两种类型的参数，即来自预训练模型的参数和Prompt的参数。根据(i) 底层LM的参数（LM params）是否被调优，(ii)是否有额外的与Prompt相关的参数（Additional），(iii)如果有额外的与提示相关的参数，这些参数是否被调优，总结了5种调优策略(如下图所示)。

先来看第二个策略：Tuning-free Prompting，根据表格可以看到这种策略不需要对LM参数进行微调，不需要额外的Prompt参数，没有任何参数的更新，因此这个策略最大的优点就是完全不需要任何有标注数据来更新模型参数，所以会适用于零样本的场景。
再看第三个策略：Fixed-LM prompt Tunning，这种策略不需要对语言模型进行任何参数调整，只需要少量标注数据对Prompt相关参数进行调整即可，适合与少样本场景。
Prompt确实为少样本和零样本场景提供了新的解题思路，不过也只使用于特定的应用场景，并不是每一种Prompt策略都适合在零/少样本场景下使用（可不要误解了哦~）

参考：
Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing：https://arxiv.org/abs/2107.13586
https://mp.weixin.qq.com/s/vyKCCjAEbuOxpKOd6zhz3w
国科大胡玥老师自然语言处理课件
刘鹏飞博士知乎回答：https://zhuanlan.zhihu.com/p/395115779

通过这一篇博客，读者应该了解到了NLP范式的发展过程，以及了解到了Prompt适用于零样本的原因，关于Prompt的细节会在下一篇博客中介绍：
详细介绍：红到发紫的Prompt是什么？【下】

你可能感兴趣的:(#,自然语言处理,#,Prompt,NLP,少样本,Prompt)

高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Mac自定义右键功能东东旭huster macos
mac右键相对于Windows来说功能少很多，市场里也有一些好用的拓展软件，比如赤友，但是用一段时间又要收费了，作为一个白嫖党当然是自己做了。打开自动操作这个应用选择快速操作打开，再从实用工具中选择运行shell脚本这里我们添加一个用vscode打开的功能有几个点需要注意下1、工作流程选择文件或文件夹2、位于访达3、传递输入选择作为自变量编辑好后可以点运行试下，没问题command+S保存一下。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
第一次在CSDN 使用Markdown编辑页，就看到了完美的语法，在此处，我记录一下撰卢编辑器笔记
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Mark
大模型MoE模型技术详解大雷神 AI 人工智能机器学习 AI 大模型
场景：大型超市的收银区域想象一下周末的超市，人山人海（就像大模型要处理海量的Token）。众多收银台（专家）：超市有20个收银台，每个收银台都是一个“专家”。有的收银台是人工柜台（擅长处理现金、复杂商品、老人购物）；有的是自助扫码机（适合年轻人、商品少、动作快）；有的是快速通道（只允许买5件商品以下的顾客）；有的是大宗商品通道（专门处理整箱饮料、大件物品）。智能引导系统（门控网络）：顾客（每个To
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
MacOS 终端(Terminal)配置显示日期时间 qifengle2014 macos ssh python java
效果1、判断当前设备终端是bash还是zshecho$SHELL结果如果是/bin/bash或/usr/local/bin/bash→bash结果如果是/bin/zsh或/usr/local/bin/zsh→zsh2、如果是zsh打开~/.zshrc文件，open-e~/.zshrc是打开文件编辑，也可以vim修改编辑内容，在加入.zshrc以下内容：PROMPT='%F{cyan}%D{%Y-%
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
思维链革命：让大模型突破“机器思考”的边界 John Song AI 人工智能思维链2.0 CoT 多模态思维链元认知优化
以下是对LilianWeng思维链技术深度解析文章（原文链接）的博客化重构，融合技术本质与应用实践：思维链革命：让大模型突破“机器思考”的边界——解析ChainofThought技术体系与下一代推理架构一、从黑箱到透明思考：CoT的核心突破传统LLM困境：“大模型如同天才自闭症患者——知识渊博却无法展示思考路径”CoT解决方案：#标准CoT提示模板prompt="""问题：小明有5个苹果，吃掉2个
LLM Agent在多模态任务中的推理机制详解
文章目录一、引言二、多模态LLMAgent的基本架构2.1系统组成2.2工作流程图三、多模态表示与对齐3.1跨模态嵌入空间3.2模态对齐技术四、多模态推理策略4.1基于提示的推理(Prompt-basedReasoning)4.2多模态思维链(CoT)推理4.3多模态工具使用五、实现案例：多模态问答系统5.1系统架构5.2示例应用六、高级多模态推理技术6.1多模态递归推理6.2多模态记忆与检索6.
sync.Mutex和sync.RWMutex的区别和它们的使用场景。sync.RWMutex在读多写少的场景下性能更好的原因。小高Baby@ golang 数据结构
Mutex是普通互斥锁，读写操作都需要先获取锁，同一时刻只能有一个goroutines在进行操作RWMtuex是读写互斥锁，读操作允许多个goroutines并发进行，写操作只允许一个goroutines进行操作Mutex适用于读写操作频繁且无明显倾向的场景，RWMutex适用于读多写少的操作。
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
15：00开始面试，15：06就出来了，问的问题有点变态。。。程序员霄霄软件测试面试职场和发展功能测试软件测试自动化测试程序人生
从小厂出来，没想到在另一家公司又寄了。到这家公司开始上班，加班是每天必不可少的，看在钱给的比较多的份上，就不太计较了。没想到4月一纸通知，所有人不准加班，加班费不仅没有了，薪资还要降40%,这下搞的饭都吃不起了。还在有个朋友内推我去了一家互联网公司，兴冲冲见面试官，没想到一道题把我给问死了：如果模块请求http改为了https,测试方案应该如何制定，修改?感觉好简单的题，硬是没有答出来，早知道好好
在LLM快速迭代时代构建持久AI应用：架构设计与实施策略
引言：技术浪潮下的开发困境大型语言模型(LLM)的发展速度令人瞠目：从GPT-3到GPT-4，从Claude1到Claude3，从Llama1到Llama3，迭代周期正在从"年"缩短到"月"。作为一名AI应用开发者，我亲身经历了这种技术浪潮带来的挑战：昨天精心调优的prompt今天可能失效；上个季度集成的模型这个季度已有更优选择；刚完成的功能设计瞬间被新模型的能力超越。在如此快速变化的环境中，如何
SpringMVC参数校验（针对`@RequestBody`返回`400`） Ryan-Miao spring spring mvc
SpringMVC参数校验（针对@RequestBody返回400）前言习惯别人帮忙做事的结果是自己不会做事了。一直以来，spring帮我解决了程序运行中的各种问题，我只要关心我的业务逻辑，设计好我的业务代码，返回正确的结果即可。直到遇到了400。spring返回400的时候通常没有任何错误提示，当然也通常是参数不匹配。这在参数少的情况下还可以一眼看穿，但当参数很大是，排除参数也很麻烦，更何况，既
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
LangChain框架 Prompts、Agents 应用 _pass_ 大模型学习 langchain
目录(Prompts)提示作用Prompts常见操作基础PromptTemplate使用Few-shot提示模板ChatPromptTemplate(对话提示模板)(Agents)代理作用Agents常见操作基础Agent使用自定义工具Agent高级应用示例带记忆的对话代理使用本地模型的代理结构化输出代理LangChain框架Loader、Vectorstores、Chain应用-CSDN博客另外
# Unity C#进阶：掌握泛型编程，告别重复代码，编写优雅复用的通用组件！（Day26）吴师兄大模型 C#编程从入门到进阶 unity c#游戏引擎 c语言开发语言游戏开发泛型编程
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
AI 提示词工程(Prompt Engineering)之提示词应用场景（信息提取）
引言：合规时代的信息提取技术在数字化浪潮中，互联网企业每天处理着海量数据——电商平台的用户评论、金融机构的交易文档、企业的合同条款……这些数据如同深埋的金矿，而信息提取技术就是挖掘价值的工具。但随着《网络数据安全管理条例》等法规的实施，信息提取已不再是简单的技术问题，而是合规与效率的平衡艺术。2025年，提示词工程已发展出专为合规场景设计的技术体系，能够精准提取有价值信息的同时，自动规避敏感内容、
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
基于MCP协议使用python实现天气预报接口实时查询全国各地天气情况 @Ma python 开发语言
Mcp_Server端：python脚本importjsonfromfastmcpimportFastMCPfromdashscopeimportGenerationimporthttpxfromtypingimportAny#初始化服务器mcp=FastMCP('WeatherServer')defchat(system_prompt:str,user_prompt:str)->str:mess
少样本图学习（few-shot learning on graph）知识背景 so.far_away 网络空间安全学习机器学习人工智能
Few-ShotLearningonGraph少样本学习简介少样本图学习简介1.SupportSet和QuerySet（针对单个任务）（1）SupportSet（支持集）（2）QuerySet（查询集）2.BaseData和NovelData（针对整个数据集）（1）BaseData/Classes（基类数据）（2）NovelData/Classes（新类数据）少样本学习简介少样本学习（FSL）旨在
数据安全审计平台的三大关键技术：日志分析、行为监测与智能告警 KKKlucifer 安全算法
在数字化浪潮中，数据安全审计是企业守护核心资产的“瞭望塔”。通过日志分析、行为监测、智能告警三大技术，数据安全审计平台构建起“全流程监控-异常识别-快速响应”的闭环，为数据安全筑牢防线。以下从技术原理、实践价值与行业应用展开解析。日志分析：数据安全的“DNA图谱”1.多源日志融合技术实现：通过Agent采集操作系统、数据库、网络设备等200+日志源，利用正则表达式、NLP技术解析非结构化日志（如“
设计模式的六大设计原则 WISHMELUCK1' 八股文设计模式里氏替换原则依赖倒置原则单一职责原则接口隔离原则迪米特法则合成复用原则
一、什么是设计模式设计模式是一套被反复使用、被多数人知晓的、代码设计经验的总结，它可以让代码更容易理解、提升代码可靠性以及更能够被复用。二、设计模式的六大原则单一原则“应该有且只有一个原因引起类的变更”，通俗来讲，一个类或接口尽可能只做一件事。如此，有以下好处：类和接口的复杂性降低，职责明确可读性好可维护性提高变更引起的风险降低，这也使开闭原则更容易实现开闭原则“可拓展，不修改（少修改）”子类替换
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他