didiqiq

李宏毅2019年新增课程 week 15 transformer 课程笔记

李宏毅2019年新增课程 week 15 transformer 课程笔记

- RNN和CNN的局限
- Self-Attention
- Self-attention 平行化
- Multi-head self-attention 以2头为例
- self-attention 局限性
- 在一个seq2seq的model里如何使用self-attention
- Transformer
- transformer原始paper的attention visualization
- transformer的应用
- Attention机制的其他参考文章

视频及课件地址：https://www.bilibili.com/video/av65521101/?p=97

RNN和CNN的局限

RNN的输入是一串vector sequence，输出是另外一串vector sequence。如果是单向的RNN，输出是 $b^4$ 的时候，会把 $a^1$ 到 $a^4$ 通通都看过，输出 $b^3$ 的时候，会把 $a^1$ 到 $a^3$ 都看过。如果是双向RNN，输出每一个 $b^1$ 到 $b^4$ 的时候，已经把整个input sequence通通都看过。

RNN存在的问题是不容易被平行化，即假设在单向的情况下要算出 $b^4$ ，需要先看 $a^1$ 再看 $a^2$ 再看 $a^3$ 再看 $a^4$ 才能算出 $b^4$ 。

解决方法：用CNN代替RNN，如图，input是一个sequence $a^1$ 到 $a^4$ ，每一个三角形都代表filter，输入是sequence中一小段，输出一个数值。若有一堆filter，输入是一个sequence，输出是另外的sequence。

CNN也有办法考虑更长的资讯，只要叠加很多层，上层的filter就可以考虑比较多的资讯。举例来说，叠了第一层CNN再叠第二层的CNN，第二层CNN的filter会把第一层的output当做input，如图蓝色的filter由 $b^1$ , $b^2$ , $b^3$ 决定输出，而 $b^1$ , $b^2$ , $b^3$ 是由 $a^1$ 到 $a^4$ 来决定他们的输出，所以等同于蓝色的filter已经看了 $a^1$ 到 $a^4$ 的内容。CNN的好处是可以平行化，每一个同颜色的filter可以同时计算。

CNN缺点：每一个CNN只能考虑非常有限的内容，要叠很多层才能看到长期资讯。

Self-Attention

Self-Attention：输入和输出都是sequence，跟Bi-RNN有同样的能力，每个输出都看过input sequence，但特别的地方是 $b^1$ 到 $b^4$ 可以并行计算。

self-Attention这个概念最早出现在谷歌的论文 Attention is all you need，意思是不需要CNN也不需要RNN，唯一需要的就是attention。

self-Attention 如何用？

如图：
1. input sequence是 $x^1$ 到 $x^4$ ，每一个input通过embedding乘上一个矩阵，变成 $a^1$ 到 $a^4$ 然后丢进self-attention layer。在每个self-attention layer里面，每个input分别乘上3个不同的transformation产生三个vector。
$q$ 代表query去和其他人做匹配， $k$ 代表key被匹配的， $v$ 代表value被抽取出来的信息。

2. 拿每个 $q$ 去对 $k$ 做attention，attention有各式各样的算法，本质是吃两个向量输出一个数，一般做self-attention layer的时候都套用原始paper的做法，不会做太多变动。

例如：拿 $q^1$ 对 $k^1$ 到 $k^4$ 做attention得到 $a_{1,1}$ 到 $a_{1,4}$ , 在self-attention layer里面attention算法用的是 scaled dot-product attention，如图公式。 $d$ 是 $q$ 和 $k$ 的维度，直观解释公式中除以 $d$ 的原因是， $q$ 和 $k$ 做dot product的数值会随着维度的增加而增大，用除以 $d$ 用来平衡。

3. soft-max，把 $a_{1,1}$ 到 $a_{1,4}$ 通过softmax得到 $\hat{a}_{1,1}$ 到 $\hat{a}_{1,4}$ ；公式如图。

4. 把 $v^1$ 到 $v^4$ 和 $\hat{a}_{1,1}$ 到 $\hat{a}_{1,4}$ 分别相乘再相加，得到sequence的第一个输出向量 $b^1$ 。
可以注意到，产生 $b^1$ 的时候用了 $v^1$ 到 $v^4$ 的weighted sum；而 $v^1$ 到 $v^4$ 由 $a_{1,1}$ 到 $a_{1,4}$ 做transformation得到，所以相当于产生 $b^1$ 的时候看了 $a_{1,1}$ 到 $a_{1,4}$ 。如果产生 $b^1$ 的时候不想考虑整个句子的资讯，只想考虑 local 的 information，可以让远的 $\hat{a}_{1,3}$ 和 $\hat{a}_{1,4}$ 的值变为0；如果考虑 global 的 information，让 $\hat{a}_{1,3}$ 和 $\hat{a}_{1,4}$ 有值就可以。

5. 重复以上步骤计算出 $b^2$ , $b^3$ , $b^4$ ，self-attention layer做的事情和RNN是一样的，与RNN不同的是， $b^1$ 到 $b^4$ 可以平行的计算出来。

Self-attention 平行化

1. 把 $a^1$ 到 $a^4$ 拼起来变成一个矩阵，用 I 来表示，然后乘 $w^q$ 得到 Q， Q 的每一列都代表一个query。同理，把 I 乘上 $w^k$ 得到 K，K 的每一列代表一个key。把 I 乘上 $w^v$ 得到 V，V 的每一列代表一个value。

2. 现在把 K 的列做转置叠加得到 $K^T$ 。拿 $q^1$ 对 $k^1$ 到 $k^4$ 做匹配，即dot product，得到一个向量 $a_{1,1}$ 到 $a_{1,4}$ ，这个计算过程是可以平行的。接下来分别把 $q^2$ , $q^3$ , $q^4$ 拿出来跟 $K^T$ 相乘得到向量。计算attention矩阵A的过程就是把矩阵 $K^T$ 乘上 Q。如果有n个input，那得到的attention就是n*n的矩阵。然后对A的每一列做softmax得到 $\hat{A}$ 。

3. 做weighted sum。把 $\hat{A}$ 对 V 相乘得到self-attention的输出 O。

总结，self-attention的输入是一个矩阵 I，输出是一个矩阵 O。self-attention里面就是一连串的矩阵乘法，而矩阵乘法可以用GPU加速。

Multi-head self-attention 以2头为例

原理：每个 $a^i$ 都会得到 $q^i$ , $k^i$ , $v^i$ ，在2头情况下，把 $q^i$ 进一步进行分裂得到 $q^{i,1}$ 和 $q^{i,2}$ ，把 $k^i$ 和 $v^i$ 也进行分裂。接下来做self-attention，只是 $q^{i,1}$ 只会对 $k^{i,1}$ , $k^{j,1}$ 跟它同样是第一个的vector做dot product得到attention，然后计算出 $b^{i,1}$ ， $q^{i,2}$ 只会对 $k^{i,2}$ , $k^{j,2}$ 做attention得到 $b^{i,2}$ ，然后把 $b^{i,1}$ 和 $b^{i,2}$ 连接起来。可以对连接起来的向量乘上一个transform做降维得到最终的输出 $b^i$ 。

多头的好处是不同的head关注的点不一样。举例来说，有的head关注local的资讯，有的head关注比较长时间的资讯，比较global的资讯，有了multi-head之后，每个head会各司其职，做自己想做的事情。

self-attention 局限性

对Self-attention来说，因为它跟每一个input vector都做attention，所以没有考虑到input sequence的顺序。

而我们希望考虑input sequence的顺序。所以在原始paper里面，每一个input $x^i$ 通过transform变成 $a^i$ 以后还要加上一个维度相同的向量 $e^i$ ， $e^i$ 是手设的，代表位置的资讯。
换一种讲法就是，在input $x^i$ 后连接一个one-hot vector $p^i$ ， $p^i$ 代表位置资讯，第i维是1，其余都是0。连接之后乘上一个矩阵 W 做transform，W 可以拆成 $W^I$ 和 $W^P$ ，把 $W^I$ 跟 $x^i$ 相乘得到 $a^i$ ， $W^P$ 跟 $p^i$ 相乘得到 $e^i$ 。 $W^P$ 是可以learn的，论文里面 $W^P$ 是人手设的，如图。

以上讲的是self-attention可以拿来取代RNN，接下来看self-attention在一个seq2seq的model里面是怎么被使用的。

在一个seq2seq的model里如何使用self-attention

一般的seq2seq model包含两个RNN，分别是encoder和decoder，输入 $x^1$ 到 $x^4$ ，输出 $o^1$ 到 $o^4$ 。Input sequence $x^1$ 到 $x^4$ 通过Bi-RNN变成 $h^1$ 到 $h^4$ ，这个Bi-RNN可以用self-attention 取代掉。Decoder 的部分也是一个RNN，也可以用self-attention 取代掉。

总之，看到RNN用self-attention替换掉。

Transformer

以把中文翻译成英文为例，encoder的输入是中文的character sequence比如说是机器学习，在decoder 给他一个begin of sequence的token就输出一个machine，在下一个timestep把machine当作输入，就输出learning，直到输出句点的时候翻译过程结束。

接下来看每一个layer做的事情。
1. 先看左半部的encoder，input通过input embedding layer变成一个vector，然后vector加上positonal encoding，接下来进入灰色的block，这个block重复N次。

2. 在灰色的block里面，第一层是multi-head attention，也就是说input一个sequence，通过multi-head attention layer 得到另外一个sequence。

3. 下一个layer是add & norm，在这一步，把multi-head attention 的 output 跟 multi-head attention 的 input 相加，得到b‘，然后做layer normalization。参考文献见ppt。
Layer normalization和batch normalization 的异同：假设有一个大小为4的batch，在batch normalization 的时候，是对同一个batch里面不同data里面的同样的dimension做normalization，希望同一个dimension 的均值为0，方差为1。而layer normalization是不需要考虑bacth的，给一个data，希望各个不同dimension的均值为0，方差为1。一般情况下layer normalization会搭配RNN一起使用。那transformer很像RNN，所以这里使用layer normalization。

4. 接下来feed forward layer 会把input sequence 的每一个vector进行处理，还有另外一个add & norm 的layer。

5. 接下来是右半部decoder的部分，这个decoder的input 是前一个time step 产生的output，通过output embedding 加上positional information，进入灰色的block，这个block重复N次。

6. 这个灰色block的第一层叫masked multi-head attention。加masked的意思是说，现在做self-attention的时候，decoder会attend 到已经产生出来的 sequence，因为还没有产生出来的无法做attention。

7. add & norm layer

8. 接下来是multi-head attention layer，这个是attend 到之前encoder的输出。

9. 接下来还有add & norm layer, feed forward layer，add & norm layer

10. 最后做linear，softmax得到最终的output

transformer原始paper的attention visualization

在上面左图中，attention的weight越大，线条越粗，attention的weight越小，线条越细，图上两两word之间都会有attention。
在上面右图中，最后一个词是tired的时候，it是attend到animal的，如果把tired换成wide，it此时attend到street。

在multi-head attention里面每一组 $q, k, v$ 都做不同的事情，比如说用一组 $q^k$ 做出来是绿色那部分，每一个word 都attend到很长时间点之后的word ；另一组 $q^k$ 做出来是红色，显然找的是local information，每一个word都要attend到它之后的下一个word。

transformer的应用

基本上原来可以做seq2seq的，都可以换成transformer。

1. 做summarization
训练一个summarizer，input是一堆文章，output是一篇具有维基百科风格的文章。如果没有transformer，没有self-attention，很难用RNN产生 $10^3$ 长的sequence，而有了transformer以后就可以实现。

2. Universal transformer
简单的概念是说，本来transformer每一层都是不一样，现在在深度上做RNN，每一层都是一样的transformer，同一个transformer的block不断的被反复使用。

3. 影像self-attention GAN
让每一个pixel都attend到其他的pixel，可以考虑比较global的资讯

Attention机制的其他参考文章

完全图解RNN、RNN变体、Seq2Seq、Attention机制
Attention机制详解（一）——Seq2Seq中的Attention
Attention机制详解（二）——Self-Attention与Transformer

你可能感兴趣的:(transformer,self-attention,李宏毅)

C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
每天都有“小感动” 河北张海霞
上次开学，在楼道值班儿的我，回到办公室后，发现我的办公桌上了一个小饭盒，打开一看，是自家腌的萝卜片，闻起来香香的，是哪位有心的孩子带来的？我猜测着……会不会是杨同学，记得开学第一天，她胃疼再加上低血糖，我曾陪她去医务室看病，并给她带回了早餐……还是李同学，那次她被别的同学欺侮，我为她主持公道。晚餐时间到了，我还带她去餐厅吃饭，引得同学们一阵羡慕……会不会是王同学，那次她眼睛不好，我陪她聊天，关心地
红手套节马小媛为中国城市环卫者公益发声：今天我手红疏狂君
#红手套节#公益活动，线头公益以及同多方资源的共同努力我们邀请到了线头公益大使马小媛马小媛，1993年5月3日出生于江苏省南京市，中国内地新生代女演员。2015年马小媛参演网剧《余罪》，饰演警校校花安嘉璐的闺蜜。2016年马小媛主演系列电影《丽人保镖》中女一号林欢馨，正式出道。此后，马小媛陆续接演了电视剧《警花与警犬2》，在网剧《你美丽李美丽》中担任女主角李美丽。拂晓，当你还在睡梦中时，这座城跟你
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
2019-03-24 李飞720
姓名：李飞企业名称：临沂鑫道食品有限公司组别373期利他1组日精进打卡第338天】【知~学习】1、阿米巴经营一段2、活用人才1段3、活法、一段【行~实践】一、修身：读书、抽烟减量、俯卧撑个跑步3公里二、齐家、劝说老爸与姑姑和好三、建功、业务洽谈【经典名句分享】1、依据原理原则追求事物的本质，以“作为人，何谓正确”进行判断2、经营者必须为员工物质和精神两方面的幸福殚精竭虑，倾尽全力，必须超脱私心，让
离奇的投毒案（七）蜗居山人
（接上文）庭审很快开始了，李妹坐在旁听席的第一排，她想看看丈夫到底是不是害死儿女的凶手。公诉人宣读起诉书后，审判长询问张春对起诉书指控的犯罪事实是否承认，张春矢口否认，当庭翻供。李妹心中一阵得意：“我早就判断丈夫不是凶手！刑警队弄错了，这下看武队长如何收场！这可是公开审理。”审判长问：“你怎么在公安机关承认犯罪事实呢？”“他们刑讯逼供，没有办法我只能承认。”李妹心里嘟囔：“俺丈夫爱我和孩子胜过爱他
《相面天师》第二百七十章血书先峰老师
跟着儿子进到房间后，李云峰不满的说道：“宋老年龄都那么大了，我说你小子就不会好好和别人说话？”就是不冲着老爷子的财富地位，那年龄也值得年轻人尊重的啊，知道李尚鸿秉性的人不会说什么，但不知道的还以为老李家没家教呢。“爸，想让人尊敬，可不是件容易的事，那老头创业之初，手上没少沾血，我凭什么尊重他啊？”李尚鸿撇了撇嘴，他虽然不知道宋世豪的发家史，但是从宋世豪早年的面相中能看得出来，这老头也不是个善茬。只
27岁儿子不结婚，父亲决定先给自己相亲找个伴：我要给儿子打个样清白路人
你妈逼你结婚了吗？现在的年轻人普遍结婚都比较晚，有的三十好几了八字还没一撇，这个时候最操心的就是父母了，他们话里话外都是催促着子女找对象结婚，甚至还会用出让人意想不到的方法，其实说到底，这也是可怜天下父母心呐。亲自给儿子打样的大爷李荣国，54岁，离异，打工收入2000多左右，家住农村平房120平。李大爷年轻时一直在工厂和工地打工，4年前才回到村里在镇政府当起了保安。李大爷的收入来自于三个部分，第一
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
李克富 | 咨询师推荐阅读书目李克富
最重要的书籍不是别人的推荐，而是自己学过的教材，不论当初使用的是哪个版本，它都是我们专业的底层代码，具有不可替代性。前不久，中国心理咨询师筹委会的一位老师邀请我罗列一个推荐书目清单作为咨询师工具包的内容，并要求“说明一下简单的分类或者作三言两语的说明”。斟酌后，我觉得自己推荐的书目大体可以分为普及类书籍、心理学书籍和心理咨询与治疗专业书籍，第三类又分为适合于咨询师新手的和有经验咨询师的。经过严格筛
鲁西南方言杂谈-麻胡一两茶叶
《汉语词典》给“麻胡”的解释是“拼音máhú，传说中人名。说法不一，以残暴著称。民间习用以恐吓小儿。谓貌丑而多须者。”的意思；《国语辞典》也给出其“传说中的坏人，用来吓唬啼哭中的小孩。也称为‘麻虎子’、‘马虎子’。唐代李匡义《资暇集．卷下．非麻胡》俗怖婴儿曰：‘麻胡来！’不知其源者，以为多髯之神而验刺者，非也。隋将军麻祜，性酷虐，炀帝令开汴河，威棱既盛，至稚童望风而畏，互相恐吓曰：‘麻祜来！’稚童
李小珍嵩县焦点初级班二期坚持分享第8天2019.3.6 快乐的老黄牛
换一个角度思考－－没有一件事只有负面意义当我们遭遇困境时，往往将眼光集中在所失去或是不好的部分，殊不知，每件事的发生都是上天给我们的礼物，只是有的礼物包装得丑陋，不合你的意或是让你的情绪低落，感到挫败罢了。很多事情都不是我们看到，所听到的那样，换种角度去思维，去看事情，会见到不同或是较深层次的那样？
《相面天师》第六百七十一章能动了先峰老师
庄孝贤的修为之前虽然比李尚鸿差上一线，但实在是相差无几，他平日里在这聚灵阵中修炼的时候，都要控制自己吸收元气的速度，以防肉体承受不住。但是此刻李尚鸿的作为，简直就是在掠夺这些天地元气，那气势如同长鲸吸水一般，很快就将整个聚灵阵范围内的灵气席卷而尽。将别墅内聚灵阵中的灵气吸收殆尽后，李尚鸿的元神似乎壮大了一分。不过这些灵气显然不足以让它满足，那团无形无色的元神居然纵身一跃，来到了观景台的龙口之处。观
正念内观练习20220622 蓝空静云
夏一、善念&感谢女儿一边说想明天放学后去看看要去北京手术的闺蜜，又一边念叨明天闺蜜要出发，家里得收拾行李什么的，是不是去了会添乱，真是个心思细腻又善解人意的姑娘。上周表姐回了趟老家，妈妈托给捎回来一些鹅蛋、鸡蛋还有自己腌的咸鸭蛋，拿回来一直放在楼下，今天拿上来收拾整理放入冰箱保鲜慢慢吃。妈妈家不养家畜，这些都是邻居们自家养的送给妈妈，妈妈又特意捎给女儿，妈妈总说自家养的比外面卖的好，好的总是会留给
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
学习| 积极心理学—习得性无助 benignHu
习得性无助——不知不觉，你居然习得了可怕的无助，从此，它将长久伴随着你，轻易不肯离去。“习得性无助”是积极心理学之父塞利格曼的研究成果，其概念由其提出。也正是因为“习得性无助”的发现，才有后来的积极心理学，所以今天我们来好好聊聊何谓习得性无助，如何走出习得性无助。01、习得性无助一、习得性无助的由来习得性无助源于经典心理学实验：美国著名心理学家、教育心理学的创始人爱德华·李·桑代克是一个科学心理学
安全演练有保障，专项督查促改进——记公道中学校园安全（化学实验）系列活动公中盛传云
近期，公道中学为了全面贯彻落实“预防为主，安全第一，综合治理”的安全工作方针，学校按照安全工作方针的要求，通过多种途径开展了以“预防演练为主，人防物防技防相结合”的主题的安全教育系列活动。11月8日，在学校校务会议上，学校党总支书记李兆兵强调，学校必须采取有力措施，不断增强教师综治安全防范意识，落实学校安全工作责任制，切实保障教师和学生的安全坚决杜绝意外事故的发生，确保校园平安稳定、教育教学工作顺
2021-10-22 c6a82911a6e5
致良知线上正心班学习第11天时间：2021年10月21日姓名：李克聪地区：山东淄博志愿：修己度人，自省利他｜当｜下｜即｜未｜来｜【自省利他致良知】今日功课1、读原文✔：2分2、准时交功课✔：2分3、日行一善✔：2分4、每日自省✔：2分（1）时刻保持恩悲敬（2）不抱怨，不说谎5、读书践行心得✔:2分菩萨为因，凡夫为果，因上努力，成果必达。自然的规律是天道，人和自然的规律是一样的。我们平时经常讲做人做
2021-04-06 四叶草_add9
中原焦点团队李金梅坚持分享第549天2021.4.6凌晨两点多忽然被乳腺疼痛惊醒，上完课后我便去了医院，结果显示三级，预约了穿刺。乳腺疾病与情绪和压力紧密相关，看来是身体向我发出信号了，果真比大脑更智慧。但愿这个信号发的并不算迟，给自己减减压，面对孩子，从心底里接纳吧！面对工作，不用精益求精，尽力就好。
《向西游记取育儿经》启示二拜师菩提第二部分：腾云驾雾识世界，开阔眼界宽胸怀暖暖的初春
图片发自App李苹瑕焦点网络初级5期平顶山持续原创分享第697天2019年04月07日星期日晴《向西游记取育儿经》启示二拜师菩提第二部分：腾云驾雾识世界，开阔眼界宽胸怀这几天恰逢清明小长假，许多家长都会带领孩子祭祖扫墓和清明踏春郊游。刚好我们这一周总第31期读书会主题：腾云驾雾识世界，开阔眼界宽胸怀。描述的是孙悟空成长初期师拜菩提所受到的启蒙教育，和现今各位家长注重孩子的早期成长和启蒙教育是不谋而
《兄弟》七刘佳琪ljq
爱的力量从来不可以被低估。最近忙碌的我住在了姥姥家，第一次一个人骑着小电驴来到了姥姥家，一切都是新的，一切对我来说都是一个挑战。记得很久以前因为妈妈和姥姥发生过一次争吵，时间是在过年得时候，我匆忙离开跑到了老太太家里，那一刻的我无比的绝望，也认识到了自己的错误。今天的我再次想起这件事情时，内心充满了愧疚感，父母之爱子，则为之计深远。李光头的母亲李兰一直在为自己的儿子着想，离去前还在叮嘱宋钢照顾李光
2003-7-13-先胜“李一季”-（让左车马-黑列手炮）夏目青樱
2003-7-13-【虎滩四战之三】先胜“李一季”-（让左车马-黑列手炮）1.炮二平五炮２平５2.马二进三马８进７3.兵三进一炮８进４4.车一进一炮８平７5.相三进一马２进３6.兵七进一车１平２7.炮八平七卒５进１8.车一平四马３进５？9.车四进二炮７平５10.车四平五车２进７？！11.炮五平八卒５进１？12.车五平八马５进４13.炮七平五炮５进５14.相七进五马４进５15.车八平六车９平８16.
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
《相面天师》第六百四十三章死在你前面先峰老师
说实话，安东尼马库斯的进攻套路虽然很简单，来来去去就是左右腿的侧踢。但是经过千万次的训练，安东尼马库斯已经将这扫腿练得炉火纯青，就是这简单的侧踢，最少带给李尚鸿三次以上致命的威胁。交战了大约有七八分钟的时间了，安东尼马库斯时而像是西伯利亚的猛虎，大开大合硬拼硬打，时而又像是狐狸一般，数次都逃过了李尚鸿的致命一击。虽然也对安东尼马库斯造成了一些伤害，但至今为止，李尚鸿也未能找到一击毙敌的机会，可是眼
小米和蛋壳第七节和三三吃饭斜晲众生
李南还是老样子，笔直，严谨，脸上线条硬度极佳，总是一副不苟言笑的样子。身上除了黑色就是深色的搭配，把自己平添了许多收敛的气息。和旁边像精灵一样的三三真真是反差萌。“我已经点好了菜。我在微博微信上已经盯了好久了，这次点菜集各家吃货推荐所长，应该不会踩雷。点了有焖鸡，牛肉饵丝，油爆猪皮，香茅烤鸡，稀豆粉，炒小瓜，蒜香鸡脚，小锅米线，黄金虾饼，喝的除了自酿米酒、苹果芒果汁和酸角汁。三碗米饭，一份菠萝饭。
小说《101所》09：官司（中）一言莫辩
经过合同、沙盘和现场对比，李天明觉得外部环境的变化，可以打打官司，至少还有沙盘模型作为证据，虽然合同里声明不能作为的合同的条款，但外部环境足以影响到是否购买底楼的房子，而且这是开发商提供的格式合同，该条款明显规避了开发商的责任，签订合同时没有特别的提示，李天明记得当初自学法律时，记得特别清楚，书上举的例子是保险合同的免责条款。慎重起见，李天明专门咨询了法院和律师朋友，虽然没有得到确切的答复，但是找
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他