m0_60413136

Attention注意力机制和位置编码的机制

文章目录

前言
一、文本张量的表示方法
- 1 One-hot Encoding
- 2 word2vec
二、注意力机制
- 1 Self-Attention
- 2 Self-Attention运算机制
- - 2.1 向量间关联度α的计算方法
  - 2.2 输出向量的计算方法
  - 2.3 常见的注意力计算规则
  - 2.4 多头注意力机制
三 Positional Encoding
- 3.1 以前的方法——表格型
- - 3.1.1 使用[0,1]范围分配
  - 3.1.2 1-n正整数范围分配
- 3.2 相对位置的关系-函数型
- - 3.2.1 运算机制
  - 3.2.2 绘制特征的分布曲线:

前言

本文为本人初学atttention机制和transform时的学习笔记，学习资料为李宏毅教授2021年的2021年春机器学习课程、黑马程序员2019年课程的部分内容以及datawhale的开源学习资料。如有理解不当之处，还望各位大佬多多指教。

一、文本张量的表示方法

文本张量的表示：将一段文本使用张量进行表示，其中一般将词汇为表示成向量，称作词向量，再由各个词向量按顺序组成矩阵形成文本表示。

1 One-hot Encoding

又称独热编码，是一种稀疏矩阵。即将每个词表示成具有n个元素的向量（n的大小是整个语料中不同词汇的总数），这个词向量中只有一个元素是1，其他元素都是0，不同词汇元素为0的位置不同。
缺点：完全割裂了词与词之间的联系，而且在大语料集下，每个向量的长度过大，占据大量内存。

2 word2vec

word2vec是一种将词汇表示成向量的无监督训练方法, 该过程需要构建神经网络模型, 将网络参数作为词汇的向量表示, 它包含CBOW和skipgram两种训练模式.

CBOW(Continuous bag of words)模式
给定一段用于训练的文本语料, 再选定某段长度(窗口)作为研究对象, 使用上下文词汇预测目标词汇.

分析：图中窗口大小为9, 使用前后4个词汇对目标词汇进行预测
skipgram模式
给定一段用于训练的文本语料, 再选定某段长度(窗口)作为研究对象, 使用目标词汇预测上下文词汇

分析：图中窗口大小为9, 使用目标词汇对前后四个词汇进行预测.

这两种方法都只考虑了一个window(窗口)内的信息，无法考虑整个sequence(句子)之间的相关性。如果使用一个比sequence长度还大的window，虽然可以覆盖整个sequence的信息，但是这需要window的长度比sequence还要长，不仅会导致参数过多，运算量大，还容易造成过拟合。

而Self-Attention，即自注意力机制，可以多个Vector并行输入，能考虑到整个input sequence的信息。

二、注意力机制

1 Self-Attention

Self-Attention的输入序列长度不固定，其对应的输出向量考虑了整个输入序列的信息，然后将输出向量输入到Fully-Connected网络中，做后续处理。

Self-Attention可以和Fully-Connected交替使用多次以提高网络的性能

1. Self-Attention处理整个Sequence的资讯
2. Fully-Connected的Network,专注于处理某一个位置的资讯
3. 再用Self-Attention,再把整个Sequence资讯再处理一次
4. 然后交替使用Self-Attention跟Fully-Connected

2 Self-Attention运算机制

2.1 向量间关联度α的计算方法

attention考虑整个input sequence的资讯，所以必须得计算每个vector之间的关联程度。α就是每一个input vector向量之间的关联的程度。

计算α有两种方法：

Dot-product
输入的这两个向量分别乘上两个不同的矩阵W^q和W^k得到j矩阵q和矩阵k，再将q和k做点乘得到α，即两个矩阵之间的关联性。
Additive
输入的这两个向量分别乘上两个不同的矩阵 W^q 和W ^k 得到j矩阵 q 和矩阵 k ，将 q 和 k 合并后经过一个激活函数，再通过一个Transform, 然后得到 α。

transform 中所用的方法为 Dot-product，所以我们以下所有的讨论只针对第一种方法

2.2 输出向量的计算方法

Step 1
a¹, a², a³, a⁴ 分别与 W^q 相乘，得到 q¹，q²，q³，q⁴。其中 q¹，q²，q³，q⁴ 统称为Query。
a¹, a², a³, a⁴ 分别与 W^k 相乘，得到k¹，k²，k³，k⁴。其中 k¹，k²，k³，k⁴ 统称为Key。
a¹, a², a³, a⁴ 分别与 W^v 相乘，得到v¹，v²，v³，v⁴。其中 v¹，v²，v³，v⁴ 统称为Value。
Step 2
q² 分别和k¹，k³，k⁴ 做Dot-product运算，得到 a¹ 与 a², a³, a⁴ 之间的关联性 α_2,1 ，α_2,3 ，α_2,4 。
这个关联性 α 叫做 Attention 的 Score。
当然，a²也需要和自己计算关联度。将 q² 与 k² 做Dot-product运算即得到 a² 与自己的关联度 α_2,2。
刚才计算得到的关联性 α 也可以接入一个激活函数（例：softmax激活函数），得到 α’_2,1 ，α’_2,2，α’_2,3 ，α’_2,4。
Step 3
得到 α’ 以后，将 α’ 与v¹，v²，v³，v⁴ 分别相乘，最后把相乘后的结果全部相加得到 b²。b² 即根据 α’ 抽取出的Sequence里面重要的资讯。
Note
若 a² 与 a¹ 关联性很强，则他们的Attention Score 的值 α’_2,1 就会很高，在做完Weighted Sum以后，得到的 b² 的值,就可能会比较接近 v¹。整个运算过程中，共涉及到三个不同的参数，分别是 W^q，W^k，W^v。

同理可以计算出其他输出向量 b¹， b³， b⁴

2.3 常见的注意力计算规则

将Q，K进行纵轴拼接, 做一次线性变化, 再使用softmax处理获得结果最后与V做张量乘法.
将Q，K进行纵轴拼接, 做一次线性变化后再使用tanh函数激活, 然后再进行内部求和, 最后使用softmax处理获得结果再与V做张量乘法.
将Q与K的转置做点积运算, 然后除以一个缩放系数, 再使用softmax处理获得结果最后与V做张量乘法.

通过计算公式得到注意力的结果, 这个结果代表query在key和value作用下的注意力表示.
当输入的Q=K=V时, 称作自注意力计算规则.

2.4 多头注意力机制

因为相关性有很多种不同的形式，所以我们应该要有多个 q，不同的 q 负责不同形式的相关性，这就是多头注意力机制。
以 2 head 注意力机制为例，得到矩阵 q 后，将 q 分别乘以两个不同的权重 W^q,1， W^q,2 得到 q^i,1， q^i,2。i 代表词汇的位置，1 和 2 分别代表第几个位置的 q。k 和 v 同理。q^i,1 和 k^i,1 做 Dot-product 运算得到 aⁱ 与自身的 attention score，q^i,1 和 k^j,1 做 Dot-product 运算得到 aⁱ 与 a^j 之间的attention score，将两个 α 分别乘以 v^i,1 和 v^j,1后相加得到 b^i,1。

同理可以得到 b^i,2。将b ^i,1 与 b ^i,2 拼接起来，乘以一个矩阵 W⁰，得到最后的输出 bⁱ。

三 Positional Encoding

3.1 以前的方法——表格型

3.1.1 使用[0,1]范围分配

这个方法的分配方式是，将0-1这个范围的，将第一个token分配0，最后一个token分配去1，其余的token按照文章的长度平均分配。具体形式如下：

我喜欢吃洋葱【0 0.16 0.32…1】
我真的不喜欢吃洋葱【0 0.125 0.25…1】

**问题：**我们可以看到，如果句子长度不同，那么位置编码是不一样，所以无法表示句子之间有什么相似性。

3.1.2 1-n正整数范围分配

这个方法比较直观，就是按照输入的顺序，一次分配给token所在的索引位置。具体形式如下：

我喜欢吃洋葱【1，2，3，4，5，6】
我真的不喜欢吃洋葱【1，2，3，4，5，6，7】

问题：往往句子越长，后面的值越大，数字越大说明这个位置占的权重也越大，这样的方式无法凸显每个位置的真实的权重。

3.2 相对位置的关系-函数型

3.2.1 运算机制

Transformer 的 Position 在 GPT-3 论文中给出的公式如下：

上个公式给出的每一个 Token 的位置信息编码不是一个数字，而是一个不同频率分割出来，和文本一样维度的向量。

得到位置向量 P之后，将和模型的embedding向量相加，得到进入Transformer模型的最终表示

3.2.2 绘制特征的分布曲线:

import matplotlib.pyplot as plt

plt.figure(figsize=(15, 5))
pe = PositionalEncoding(20, 0)
y = pe(Variable(torch.zeros(1, 100, 20)))
plt.plot(np.arange(100), y[0, :, 4:8].data.numpy())
plt.legend(["dim %d"%p for p in [4,5,6,7]])
plt.show()

输出曲线：

效果分析:

每条颜色的曲线代表某一个词汇中的特征在不同位置的含义.
保证同一词汇随着所在位置不同它对应位置嵌入向量会发生变化.
正弦波和余弦波的值域范围都是1到-1这又很好的控制了嵌入数值的大小, 有助于梯度的快速计算.

你可能感兴趣的:(NLP入门之transform,自然语言处理,深度学习,神经网络)

分类模型（BERT）训练全流程巴伦是只猫人工智能分类 bert 数据挖掘
使用BERT实现分类模型的完整训练流程BERT(BidirectionalEncoderRepresentationsfromTransformers)是一种强大的预训练语言模型，在各种NLP任务中表现出色。下面我将详细梳理使用BERT实现文本分类模型的完整训练过程。1.准备工作1.1环境配置pipinstalltransformerstorchtensorflowpandassklearn1.2
每日心语：让生命之花绚烂绽放把平平凡凡的生活过成诗与远方
我一直坚信，有生命就要有梦想。有梦想生命才无价！我的梦想——把平平凡凡的生活过成诗与远方。听起来很有诗意对吧。可想把平平凡凡的生活过成富有诗意的诗与远方，是需要觉醒的。实现梦想的过程正是一次次觉醒生命的历程。（一）认知生命我初中是在坡胡三中上的。记得初中上早读时，尤其大冬天，从家出门，天还黑洞洞一片呢！去学校的途中，要经过王庄村东头的一片坟地。当时上学时，经常是村上我们三五个男生女生结伴而行。男生
班级管理杂谈（老王唠教育）之九十八东哥杂谈
班级管理杂谈之九十八家访是与家长沟通的基本途径，过去要求班主任每学期每个学生要进行一次家访。近几年来由于沟通方面的科学技术越来越发达，很多班主任忽视了家访的意义。走出校门，进入学生家庭，符合课程改革的“以生为本”的思想，更能缩短教师与学生家长之间的距离，更能便捷、顺利地解决问题。学生家长年龄有长幼之分，知识水平、思想水平有高低之分，处境心情有好坏之分等，教师家访时要考虑不同对象的可接受性，以“心理
CSS中的transform 骑驴看星星a css 前端 javascript 开发语言 ecmascript linux 学习
在CSS中，transform是用于用于用于对元素进行几何变换的属性，可实现旋转、缩放、平移、倾斜等效果，且不会影响其他元素的布局（不会触发重排）。以下是其核心用法和特性：1.基本语法element{transform:变换函数1(参数)变换函数2(参数);/*多个变换可叠加*/transform-origin:x-axisy-axis;/*变换原点（默认中心）*/transition:trans
python排序算法之基数排序华强笔记 python数据结构和算法 python 算法
#代码如下：'''基数排序：1.把数据分为10个桶，以为数字有0-9这10个2.依次把数据的个位，十位，百位等等各个位数的数据进行分桶排序，放在这10个桶中3.最大的数有k位，则循环k次4.时间复杂度O(kn),空间复杂度O(k+n),其中k=log10(n)+1'''defradixs_sort(li):max_num=max(li)it=0while10**it<=max_num:bucket
【C语言编写随机数生成器】-经典C语言程序100例之十二 DevRevolt c语言算法开发语言编程
【C语言编写随机数生成器】-经典C语言程序100例之十二随机数在计算机编程中是非常重要的一种技术，因为它可以用于创建随机序列、密码学、统计分析等多个领域。本文介绍了使用C语言编写随机数生成器的方法。C语言提供了rand()和srand()函数来生成伪随机数。其中，srand()函数用于初始化随机数发生器，而rand()函数则返回0到RAND_MAX（通常为32767）之间的随机整数。这两个函数的使
复刻表劳力士哪款最真(盘点十款最真的复刻劳力士手表高品质复刻手表商家
实测对比：劳力士高仿的表值得买吗？性能与原装大PK！劳力士，这个名字在腕表界如同璀璨星辰，令人向往。然而，真品与仿品之间的界限，往往让人心生疑虑。今日，我们不谈正统，不议真假，只论劳力士高仿的表，是否真的值得你我倾心一购？一、精湛工艺，复刻传奇劳力士高仿的表值得买吗？“工欲善其事，必先利其器。”高仿劳力士，其工艺之精，足以让行家侧目。它们不仅仅是模仿，更是对经典的一种致敬与传承。二、价格亲民，魅力
Android UI 组件系列（五）：CheckBox、RadioButton 与 Switch 控件详解
博客专栏：Android初级入门UI组件与布局源码：通过网盘分享的文件：Android入门布局及UI相关案例链接:https://pan.baidu.com/s/1EOuDUKJndMISolieFSvXXg?pwd=4k9n提取码:4k9n引言在Android开发中，用户与应用的交互往往离不开各种“选择”操作，例如：注册表单中选择兴趣爱好（可多选）设置界面中切换通知、Wi-Fi开关（开/关状态）
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
我竟然开始看大部头… 姚Fay
最近在看社会心理学，这本书虽然只看到一百多页，对我的影响之深远，不可名状。主要是以下以个方面：对自我意识偏差的认知，对思维漏洞的认知。这两个方面，在《原则》的作者看来是自我进化过程中最大的两个障碍，在查理芒格写的书中也有大篇幅来阐述，与高效能人士的七个习惯里的描述也有非常多的关联。看教材的效率果然高很多，只是通过其他名人的解读后，你能更好的深化理解这些知识点。自我意识偏差记忆也可能有误，我们做出的
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
C练题笔记之：牛客-HJ012.字符串反转
题目：描述接受一个只包含小写字母的字符串，然后输出该字符串反转后的字符串。（字符串长度不超过1000）输入描述：输入一行，为一个只包含小写字母的字符串。输出描述：输出该字符串反转后的字符串。示例1输入：abcd复制输出：dcba结果：解题思路：获取字符串，用双指针，一头一尾开始交换，直至到中间。代码：#include#includeintmain(){charstr[1024]={};scanf(
刀神传说：第52章江晓生篇（18）刀神传说
众人不知道曹无邪葫芦里卖什么药，都看向他。子午镇上的行人越来越少，已经到了掌灯时刻，江晓生吩咐道：“小何！开灯。”很快，“寻欢客栈”四面共八盏孔明灯点亮了。曹无邪把对折的告示在手上慢慢摊开，告示摊开后长1米，宽60厘米。曹无邪说：“这是我从大梁街上告示栏揭下来的。”苏残问：“告示说什么？”曹无邪念道：魏王有令，今闻刀神李流水银弧刀被偷，此贼甚是大胆。银弧刀乃魏王钦赐刀神李流水之圣物，天下共知。凡是
【流水账】平淡一日金台望道
6月4日，星期五，晴【流水账】平淡一日早上：继续充实《启蒙第一课》第二册内容。上午：开始阅卷，半上午完成一个班的判卷。下午：参加教学改革经验座谈交流会，散会后搭同事便车一起回京。晚上：仅得完成当日百件文物之推送。
可转债投资之——小盘可转债大秀大长腿蛙声叫叫一家亲
“感觉许久没提可转债了，这段时间确实没啥好说的，可转债价格跟随正股不断下跌，可转债等权指数从3月初冲高后持续回落，这几天稍微企稳。最近有个特别值得一提的现象，就是许多小规模转债，特别是次新小规模转债，轮番轰炸暴涨，天天秀着20cm、30cm的大长腿，看着让人眼馋。先说说蛙哥最近的可转债持仓情况，截至发文前，今年可转债亏损3.78%，仓位上升到80.68%。整体趋势是亏损仍在缓慢小幅加大，仓位却在上
【常识】常见考点之“初唐四杰” 公基大视野
初唐四杰，中国唐代初年，文学家王勃、杨炯、卢照邻、骆宾王的合称。简称“王杨卢骆”。他们都是初唐中后期很有才华的诗文作家，四人才名早享，在青少年时代就获得“四杰”的美誉。四杰齐名，原并非指其诗文，而主要指骈文和赋而言。后遂主要用以评其诗。四杰正是初唐文坛上新旧过渡时期的人物。他们的诗歌扭转了唐朝以前萎靡浮华的宫廷诗歌风气，使诗歌题材从亭台楼阁、风花雪月的狭小邻域扩展到江河山川、边塞江漠的辽阔空间，赋
2022-02-17 我爱你我是你我们是一
你须无依赖外的在任何和人事，就改能变自己生的命。你所之以不知道，那因是为你已遗经忘了己自是谁。你力的量是在内的，而不是在外的，所也以不需要依外赖在的任事何物，这远你比所想容的易多了，如你果想要变改生命，你要所做的是就愿意去担承百分之的百责任。对不起，请原谅，谢谢你，我爱你。[爱心][爱心]
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
【沧海行系列】鬼域行——第十六章乱琼碎玉沧海行人
而我最不喜欢阴阳分明的东西了。要知道阴在阳之内，不在阳之对。我们要充分利用自己的优势，打入敌营陇南地界，早早就有人准备好了酒菜等候何平等人。为首的人回报道：“何长老，我等追查了很久，没有黄长老的痕迹啊。”何平听了，心里已经有九成把握听到的是这个回答了，但她还是叹了口气去，又问道：“上次那妖女的事可曾继续扩散？”那人又说：“这事奇就奇在这，眼下不知是什么人，平息了流言，如今知道那女子身有鉴空遗书的人
王阳明心外无物，是一种先后观，不是主客观2022-05-08 仁也
王阳明心外无物，是一种先后观，不是主客观王阳明说的心外无物，不是在所谓的主客观层面上说的，不是说心之外就没有客观世界存在，如果你从主客观的层面来解读心学，其实是走偏了。【原文】爱问：“‘知止而后有定’，朱子以为‘事事物物皆有定理’，似与先生之说相戾。”【仁也详解】徐爱问：“知止而后有定”，朱熹认为是事事物物都有定理的意思，这个好像和先生的说法相悖？徐爱这里问的，还是“四书”中的入门书《大学》里面的
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
湖州寻人做dna在哪个地方做(附2024年最新亲子鉴定办理流程) 成之嘉_基因检测
2024年湖州最新亲子鉴定收费标准：个人隐私亲子鉴定收费标准：￥2000-￥2400，常见用途：怀疑孩子的父亲身份，想私下偷偷检测；无创胎儿亲子鉴定收费标准：￥4500-￥5000，常见用途：孩子未出世，怀疑胎儿的父亲身份，想思想偷偷检测；司法亲子鉴定收费标准：￥2400-￥3600，常见用途：上户口、移民；免费领取详细办理流程资料：15021537790（微信同号）成之嘉亲子鉴定优势1、全程匿名
中国历史上的大奸大恶，秦始皇的近臣赵高，如何致秦朝15载而亡？百途美BatonMe
秦始皇统一天下，结束了各诸侯国间的长期混战，迎合了“分久必合”的历史发展大趋势；然而，为了加强咸阳朝堂对全国的控制，秦帝国刚建立不久便要大兴土木。修长城、修直道、修驰道、修六国宫殿群和举办各种盛大典礼，如此的耗费巨大成为了民生不可承受之重，令这个新生的帝国很快就危机四伏了。秦始皇崩于第五次大巡狩，秦帝国局势波谲云诡秦始皇最后一次大巡狩的行进路线队伍行至今山东平原县时，秦始皇突然一病不起，病势急转直
大学英语四级阅读之细节阅读答题技巧英闻者说
长篇巨制！！建议收藏起来慢慢看~细节阅读是最为常见的一种阅读题型了，但是它在四级考试中又有独特之处。本文将从整体概况，题材体裁，出题特点，答题程序和答案特点五个部分对细节阅读做出剖析，同时会引用历年真题给出例证，仔细学习后自会对这种题型有着全新的理解和更好的把握。一、整体概况细节阅读一共2篇，字数大概都在350左右，分段情况不太好说，大多在5段以上（几乎没有平时模拟题里出现的两段或三段的情况）。想
大师兄点评清平乐|为君纳谏之道大师兄缪玮76
以人以史为镜，提升人文素质。欢迎来到大师兄点评历史之清平乐。夏竦之妻因夏竦欲纳妾而一纸状书将其告了。谏官借此事进宫谏言，不仅弹劾夏竦私德不佳，更谏言官家宫中宫仆众多，为避免仁宗耽于享乐，应当裁减宫人。仁宗以夏竦之事乃私事非国事而堵住了谏官的谏言。但回到后宫后，因梳头夫人李司饰恃宠生娇，妄议朝政而将自李司饰以下30人皆放逐出宫。而仁宗这一前一后的态度转变究竟是为何呢？在此后仁宗与怀吉的复盘中说了个明
相儒养老院-相儒养老价格、环境详询小李带你看养老
相儒养老：全方位照护，乐享金色年华在北京市丰台区葆台西路一号院这片充满温情的土地上，相儒养老以其专业的服务、温馨的环境和全面的照护体系，成为了众多老年人及其家庭信赖的养老之选。本文将详细介绍相儒养老的收费情况、地址位置、床位信息及收住的老人类别，并探讨其如何为老年人打造一个安心、快乐的晚年生活。电话：400-996-2290【北京相儒养老院】电话：400-996-2290（24小时热线）北京相儒养
深度学习图像分类数据集—百种病虫害分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：百种病虫害识别分类，训练集45095张，验证集7508张，测试集22619张具体类别为以下：insect_classes=["rice_leaf_roller","rice_leaf_caterpillar
北洋十八载之第一百四十五回逆水行舟林墨臻
对曹锟这番骚操作，大吴碍于情面，虽然嘴上没说，心里却是很不满意。看来三爷也就只能混到这地步了，想想人家朱重八，实力足以称王称霸，可为了达到更高的人生目标，人家是忍着，让着，等着。直到把大半个中国收入囊中，天下再无齐头并行者，才舒舒服服的坐上头把交椅。你三爷也不好好看看周围环境，没错，咱直隶现在确实是民国这盘棋里唯一的超级霸主，可周边的那些也不好惹啊。胡子张仗着背后有日本这个超级奶妈，那是忙着修桥铺
2020.05.23《毛泽东选集》持久战的三个阶段聂贝贝
持久战的三个阶段中日战争是持久战，具体表现在三个阶段之中，第一个阶段是敌之战略进攻，我之战略防御的时期，我方的战争形式以运动战为主，以游击战和阵地战辅助。第二个阶段是敌之战略保守，我之准备反攻的时期，我方的战争形式以游击战为主，以运动战辅助。第三个阶段是我之战略反攻，敌之战略退却的时期，我方的战争形式以运动战为主，阵地战也将提到重要地位。在第一阶段，中国的劣势更为严重，土地人口，经济力量，军事力量
开源Agent平台Dify源码剖析系列（六）核心模块core/agent之CotCompletionAgentRunner ATM006 机器智能人工智能大模型人机协同 Agent Dify
每一篇文章都短小精悍，不啰嗦。笔者寄语本期介绍Dify框架的核心模块core/agent。接下来我们一起深入剖析core/agent目录下的所有代码，并以通俗易懂的方式解释。我们需要先了解这个目录的完整结构，然后逐个分析关键文件，最后总结整个Agent框架的设计和工作原理。首先，让我查看core/agent目录的完整结构：dify/api/core/agent.├──base_agent_runn
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * <p>方法描述:sql语句查询返回List<Class> </p> * <p>方法备注: Class 只能是自定义类 </p> * @param calzz * @param sql * @return * <p>创建人：王川</p> * <p>创建时间：Jul

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他