山阴少年

NLP（二十九）一步一步，理解Self-Attention

本文大部分内容翻译自Illustrated Self-Attention, Step-by-step guide to self-attention with illustrations and code，仅用于学习，如有翻译不当之处，敬请谅解！

什么是Self-Attention（自注意力机制）？

如果你在想Self-Attention（自注意力机制）是否和Attention（注意力机制）相似，那么答案是肯定的。它们本质上属于同一个概念，拥有许多共同的数学运算。
一个Self-Attention模块拥有n个输入，返回n个输出。这么模块里面发生了什么？从非专业角度看，Self-Attention（自注意力机制）允许输入之间互相作用（“self”部分），寻找出谁更应该值得注意（“attention”部分）。输出的结果是这些互相作用和注意力分数的聚合。

一步步理解Self-Attention

理解分为以下几步：

准备输入；
初始化权重；
获取key，query和value；
为第1个输入计算注意力分数；
计算softmax;
将分数乘以values；
对权重化后的values求和，得到输出1；
对其余的输入，重复第4-7步。

注意：实际上，这些数学运算都是向量化的，也就是说，所有的输入都会一起经历这些数学运算。我们将会在后面的代码部分看到。

第一步：准备输入

在这个教程中，我们从3个输入开始，每个输入的维数为4。

Input 1: [1, 0, 1, 0] 
Input 2: [0, 2, 0, 2]
Input 3: [1, 1, 1, 1]

第二步：初始化权重

每个输入必须由三个表示（看下图）。这些输入被称作key（橙色），query（红色）value（紫色）。在这个例子中，我们假设我们想要的表示维数为3。因为每个输入的维数为4，这就意味着每个权重的形状为4×3。

注意：我们稍后会看到value的维数也是output的维数。

为了获取这些表示，每个输入（绿色）会乘以一个权重的集合得到keys，乘以一个权重的集合得到queries，乘以一个权重的集合得到values。在我们的例子中，我们初始化三个权重的集合如下。
key的权重：

[[0, 0, 1],
 [1, 1, 0],
 [0, 1, 0],
 [1, 1, 0]]

query的权重：

[[1, 0, 1],
 [1, 0, 0],
 [0, 0, 1],
 [0, 1, 1]]

value的权重：

[[0, 2, 0],
 [0, 3, 0],
 [1, 0, 3],
 [1, 1, 0]]

注意：在神经网络设置中，这些权重通常都是一些小的数字，利用随机分布，比如Gaussian, Xavier and Kaiming分布，随机初始化。在训练开始前已经完成初始化。

第三步：获取`key`，`query`和`value`；

现在我们有了3个权重的集合，让我们来给每个输入获取key，query和value。
第1个输入的key表示：

               [0, 0, 1]
[1, 0, 1, 0] x [1, 1, 0] = [0, 1, 1]
               [0, 1, 0]
               [1, 1, 0]

利用相同的权重集合获取第2个输入的key表示：

               [0, 0, 1]
[0, 2, 0, 2] x [1, 1, 0] = [4, 4, 0]
               [0, 1, 0]
               [1, 1, 0]

利用相同的权重集合获取第3个输入的key表示：

               [0, 0, 1]
[1, 1, 1, 1] x [1, 1, 0] = [2, 3, 1]
               [0, 1, 0]
               [1, 1, 0]

更快的方式是将这些运算用向量来描述：

               [0, 0, 1]
[1, 0, 1, 0]   [1, 1, 0]   [0, 1, 1]
[0, 2, 0, 2] x [0, 1, 0] = [4, 4, 0]
[1, 1, 1, 1]   [1, 1, 0]   [2, 3, 1]

让我们用相同的操作来获取每个输入的value表示：

最后是query的表示：

               [1, 0, 1]
[1, 0, 1, 0]   [1, 0, 0]   [1, 0, 2]
[0, 2, 0, 2] x [0, 0, 1] = [2, 2, 2]
[1, 1, 1, 1]   [0, 1, 1]   [2, 1, 3]

注意：实际上，一个偏重向量也许会加到矩阵相乘后的结果。

第四步：为第1个输入计算注意力分数

为了获取注意力分数，我们从输入1的query（红色）和所有keys（橙色）的点积开始。因为有3个key表示（这是由于我们有3个输入），我们得到3个注意力分数（蓝色）。

            [0, 4, 2]
[1, 0, 2] x [1, 4, 3] = [2, 4, 4]
            [1, 0, 1]

注意到我们只用了输入的query。后面我们会为其他的queries重复这些步骤。

第五步：计算softmax

对这些注意力分数进行softmax函数运算（蓝色部分）。

softmax([2, 4, 4]) = [0.0, 0.5, 0.5]

第六步：将分数乘以values

将每个输入（绿色）的softmax作用后的注意力分数乘以各自对应的value（紫色）。这会产生3个向量（黄色）。在这个教程中，我们把它们称作权重化value。

1: 0.0 * [1, 2, 3] = [0.0, 0.0, 0.0]
2: 0.5 * [2, 8, 0] = [1.0, 4.0, 0.0]
3: 0.5 * [2, 6, 3] = [1.0, 3.0, 1.5]

第七步：对权重化后的values求和，得到输出1

将权重后value按元素相加得到输出1：

  [0.0, 0.0, 0.0]
+ [1.0, 4.0, 0.0]
+ [1.0, 3.0, 1.5]
-----------------
= [2.0, 7.0, 1.5]

产生的向量[2.0, 7.0, 1.5]（暗绿色）就是输出1，这是基于输入1的query表示与其它的keys，包括它自身的key互相作用的结果。

第八步：对输入2、3，重复第4-7步

既然我们已经完成了输入1，我们重复步骤4-7能得到输出2和3。这个可以留给读者自己尝试，相信聪明的你可以做出来。

代码

这里有PyTorch的实现代码，PyTorch是一个主流的Python深度学习框架。为了能够很好地使用代码片段中的@运算符, .T and None操作，请确保Python≥3.6，PyTorch ≥1.3.1。

1. 准备输入

import torch

x = [
  [1, 0, 1, 0], # Input 1
  [0, 2, 0, 2], # Input 2
  [1, 1, 1, 1]  # Input 3
 ]
x = torch.tensor(x, dtype=torch.float32)

2. 初始化权重

w_key = [
  [0, 0, 1],
  [1, 1, 0],
  [0, 1, 0],
  [1, 1, 0]
]
w_query = [
  [1, 0, 1],
  [1, 0, 0],
  [0, 0, 1],
  [0, 1, 1]
]
w_value = [
  [0, 2, 0],
  [0, 3, 0],
  [1, 0, 3],
  [1, 1, 0]
]
w_key = torch.tensor(w_key, dtype=torch.float32)
w_query = torch.tensor(w_query, dtype=torch.float32)
w_value = torch.tensor(w_value, dtype=torch.float32)

3. 获取`key`，`query`和`value`


keys = x @ w_key
querys = x @ w_query
values = x @ w_value

print(keys)
# tensor([[0., 1., 1.],
#         [4., 4., 0.],
#         [2., 3., 1.]])

print(querys)
# tensor([[1., 0., 2.],
#         [2., 2., 2.],
#         [2., 1., 3.]])

print(values)
# tensor([[1., 2., 3.],
#         [2., 8., 0.],
#         [2., 6., 3.]])

4. 为第1个输入计算注意力分数

attn_scores = querys @ keys.T

# tensor([[ 2.,  4.,  4.],  # attention scores from Query 1
#         [ 4., 16., 12.],  # attention scores from Query 2
#         [ 4., 12., 10.]]) # attention scores from Query 3

5. 计算softmax

from torch.nn.functional import softmax

attn_scores_softmax = softmax(attn_scores, dim=-1)
# tensor([[6.3379e-02, 4.6831e-01, 4.6831e-01],
#         [6.0337e-06, 9.8201e-01, 1.7986e-02],
#         [2.9539e-04, 8.8054e-01, 1.1917e-01]])

# For readability, approximate the above as follows
attn_scores_softmax = [
  [0.0, 0.5, 0.5],
  [0.0, 1.0, 0.0],
  [0.0, 0.9, 0.1]
]
attn_scores_softmax = torch.tensor(attn_scores_softmax)

6. 将分数乘以values

weighted_values = values[:,None] * attn_scores_softmax.T[:,:,None]

# tensor([[[0.0000, 0.0000, 0.0000],
#          [0.0000, 0.0000, 0.0000],
#          [0.0000, 0.0000, 0.0000]],
# 
#         [[1.0000, 4.0000, 0.0000],
#          [2.0000, 8.0000, 0.0000],
#          [1.8000, 7.2000, 0.0000]],
# 
#         [[1.0000, 3.0000, 1.5000],
#          [0.0000, 0.0000, 0.0000],
#          [0.2000, 0.6000, 0.3000]]])

7. 对权重化后的values求和，得到输出

outputs = weighted_values.sum(dim=0)

# tensor([[2.0000, 7.0000, 1.5000],  # Output 1
#         [2.0000, 8.0000, 0.0000],  # Output 2
#         [2.0000, 7.8000, 0.3000]]) # Output 3

注意：PyTorch已经提供了这个API，名字为nn.MultiheadAttention。但是，这个API需要你提供PyTorch的Tensor形式的key，value，query。还有，这个模块的输出会经历一个线性变换。

自己实现？

以下是笔者自己写的部分。
对于不熟悉PyTorch的读者来说，上述的向量操作理解起来有点困难，因此，笔者自己用简单的Python代码实现了一遍上述Self-Attention的过程。
完整的Python代码如下：

# -*- coding: utf-8 -*-

from typing import List
import math
from pprint import pprint

x = [[1, 0, 1, 0], # Input 1
     [0, 2, 0, 2], # Input 2
     [1, 1, 1, 1]  # Input 3
    ]

w_key = [[0, 0, 1],
        [1, 1, 0],
        [0, 1, 0],
        [1, 1, 0]
        ]

w_query = [[1, 0, 1],
            [1, 0, 0],
            [0, 0, 1],
            [0, 1, 1]
          ]

w_value = [[0, 2, 0],
            [0, 3, 0],
            [1, 0, 3],
            [1, 1, 0]
          ]


# vector dot of two vectors
def vector_dot(list1: List[float or int], list2: List[float or int]) -> float or int:
    dot_sum = 0
    for element_i, element_j in zip(list1, list2):
        dot_sum += element_i * element_j

    return dot_sum


# get weights matrix by x, using matrix multiplication
def get_weights_matrix_by_x(x, weight_matrix):
    x_matrix = []
    for i in range(len(x)):
        x_row = []
        for j in range(len(weight_matrix[0])):
            x_row.append(vector_dot(x[i], [_[j] for _ in weight_matrix]))

        x_matrix.append(x_row)

    return x_matrix


# softmax function
def softmax(x: List[float or int]) -> List[float or int]:
    x_sum = sum([math.exp(_) for _ in x])
    return [math.exp(_)/x_sum for _ in x]


x_key = get_weights_matrix_by_x(x, w_key)
x_value = get_weights_matrix_by_x(x, w_value)
x_query = get_weights_matrix_by_x(x, w_query)
# print(x_key)
# print(x_value)
# print(x_query)

outputs = []
for query in x_query:
    score_list = [vector_dot(query, key) for key in x_key]
    softmax_score_list = softmax(score_list)

    weights_list = []
    for i in range(len(softmax_score_list)):
        weights = [softmax_score_list[i] * _ for _ in x_value[i]]
        weights_list.append(weights)

    output = []
    for j in range(len(weights_list[0])):
        output.append(sum([_[j] for _ in weights_list]))

    outputs.append(output)

pprint(outputs)

输出结果如下：

[[1.9366210616669624, 6.683105308334811, 1.5950684074995565],
 [1.9999939663351456, 7.9639915951322156, 0.0539764053125496],
 [1.9997046127769653, 7.759892254657784, 0.3583892946751152]]

总结

本文主要讲述了如何一步一步来实现Self-Attention机制，对于想要自己实现算法的读者来说，值得一读。
本文分享到此结束，感谢大家的阅读~

你可能感兴趣的:(NLP（二十九）一步一步，理解Self-Attention)

2023-10-12 胡喜平
DAY2为什么读经典？经典是什么？是丑小鸭、孙悟空；是莎士比亚、苏东坡。经典就是永恒，无论哪个时代的人读他们，都能从中有自己的发现和体会。也曾喜欢过流行小说，除了短暂的阅读快感，它们在我的大脑里并没有留下什么。而每一次读鲁迅读古诗，我却都有不同的理解。于是，我悟了。不要满足于快餐，而要去品尝食物的本味。或许初识并不动人，却耐得住咀嚼。这就是阅读经典的意义吧？
2023-09-15 如鱼饮水2020
中原焦点团队坚持分享第1319天（20230915）昨晚就有些小兴奋，想象三个月不见的宝宝，会有哪些惊喜的变化。为迎接周岁生日回家的宝贝大扫除。早晨起来再次重新擦地板除尘，忽然听到微信里的消息是孩子发烧了，一瞬间脑子僵住了，怎么办？先上医院吧。除了牵挂之外，这边定好的宾馆、酒店、宴席、蛋糕等庆生活动以及旅游安排，如何更改？可能这些都无法成行。完全能理解孩子突发状况，内心还是有失落的，准备了这么多，
练太极拳的不能有刀兵气玄同说太极
看倌：太极拳的形，干什么用的？玄同：就是为更好的理解气。例如金刚捣碓，其实捣的不是碓，是碓舀里的物件；太极拳的震脚，其实震的不是脚，是身体里的气。我们对气的下行不清晰，所以借一下：震脚。看倌：太极拳怎么看待呼吸？玄同：无论打拳还是不打拳，每一个呼吸都要走小肚子，这是太极拳的核心。慢慢的，懂了丹田的开合之后，再炼弹抖。太极拳的弹抖不是手抖，都是丹田的弹抖。丹田的弹抖，不能空，要逐渐增加负重。看倌：开
教育者与教书匠啊大甘
教育者与教书匠教育是教师终身奉行的事业，也是必须负责的工作。因为我们面对的是人，是具有生命张力的个体。所以在教育中我一直也在区分教育家与教书匠的区别。一名教师有超高的教学能力，我认为不是叫教育家，而没有教学实践的积累的教师空有一套教学理论也走不到教育家的行列。纵观历史每一位教育专家是一步到位的。没有听说谁从师范院校出来就去了教育管理的岗位，教育容不得差错，教育也不是随便试试。教育需要付出实际行动，
盘复田小染
盘复时间+时间陈述情绪+情绪分析总结(经验教训)重新来过怎样可以做的更好(这次)鼓励+下一步动作(新目标)
Grafana Loki Helm Chart从2.x升级到3.0的完整指南芮川琨Jack
GrafanaLokiHelmChart从2.x升级到3.0的完整指南前言GrafanaLoki3.0版本的HelmChart是一个重要的里程碑版本，它整合了之前两个独立的Chart（loki和loki-simple-scalable）为一个统一的解决方案。本文将详细介绍如何从2.x版本平滑升级到3.0版本，帮助用户理解升级过程中的关键变化和注意事项。升级前的准备工作在进行任何升级操作前，请务必：
想晴小鱼缸呀
今天又是好的一天，阳光暖洋洋的，徐徐微风让人好舒服，人们都在忙碌着，夏晴看着来来往往的人群，不由自主又想到了自己，“哎，为什么我就跟人们不一样呢？”于是越想越烦躁，扯着自己的小布袋，一步一步的朝着家里走去，“喂，你在干嘛”，夏晴突然抬头，看清了迎面而来的人，“李想？你在这里干嘛？”“等你啊，这还用问？是没看见我还是怎么的？”李想有些埋怨的道。“哦，我正在欣赏这风景，天气真好，你的出现就是破坏了这个
小虎安防运动教官集训第一天总结 peter_a398
今天是我来小虎安防运动训练的第一天,让我真实的认识了小虎安防运动意义。从早上清脆的哨音让我从新回到那紧张的生活节奏,七天的集训听着很简单,实际上也很简单哈哈,但是要把东西简单易懂有气氛的教给小朋友让其学会其实不是一件容易的事,因为每个小朋友理解接受事物能力是不一样的。该怎样去带小朋友呢这个问题一直在我的脑海中不停的翻来覆去。直到黎导师说到我们出去做个游戏,走出学习室的房间,金灿灿的阳光撒在了我的身
540. 有序数组中的单一元素含泪若笑
这道题用二分查找的话需要注意间隔，因为有相同的元素在一起，还有就是要判断好单个的元素在哪里。第一种我看了官方的，觉得比较容易理解和想到，就实现了一下：思路就是判断中间元素是和前一个相等还是后面的相等，1如果和后面的相等，后面的元素以middle为分界点还是偶数个的话，那就说明单个元素在后面，因为我们需要去掉middle的下一个元素去考虑；2如果和前面的相等，后面的元素以middle为分界点还是偶数
个人养老金制度将推进全面实施，存个人养老金可以抵多少个税？花姐会计
姜琳、黄垚/新华社记者24日从人力资源社会保障部举行的新闻发布会上获悉，在36个城市及地区先行实施的个人养老金制度，目前运行平稳，先行工作取得积极成效。下一步将推进个人养老金制度全面实施。从整个社会保障情况看，截至2023年底，全国基本养老、失业、工伤保险参保人数分别为10.66亿人、2.44亿人、3.02亿人，同比增加1336万人、566万人、1054万人。全年三项社会保险基金收入7.92万亿元
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
想提高高中英语阅读理解水平，有什么方法，或者怎么提高单词量？大咖看学习
高中英语阅读理解的逻辑思维难度相当于小学语文五年级，题型难度则相当于小学语文三年级，因为都是“四选一”的选择题，可以猜答案。所以，本质上高中英语阅读就是在考理解，拿到满分还是比较容易的。影响高中英语阅读理解能力的因素有两点：①单词：即高考所规定的高中英语3500词，高考是明确单词不超纲的，但凡遇到超纲单词，单词边上就会标注中文意思。所以，背单词是英语阅读拿到基本分数的关键。3500词，只要能做到看
青年人才当如“沙棘” 扎根科技“沃土” 无敌炫酷的雯
近日，中办国办印发《关于进一步加强青年科技人才培养和使用的若干措施》（以下简称《措施》）明确，要遵循科研活动规律和人才成长规律，建立和完善青年科技人才评价机制，完善自然科学领域博士后培育机制，加大青年科技人才生活服务保障力度，支持青年科技人才在国家重大科技任务中“挑大梁”、“当主角”。沙棘，是广泛生长于西北戈壁的一种作物，具有适应性强、耐瘠薄、耐寒耐旱的特点，是西北地区改善生态环境、促进乡村振兴、
大单元教学反思之三 248广州刘在丽
2.没能兼顾学生教辅作业上的部分题目，像修辞手法的判断、课外文章的理解与分析等题目，一直带上来的班级学生做题稍微能结合模糊的旧知识答题，新接班的基础薄弱的学生基本上属于乱做，连修辞手法的判断都没有积累到方法。只好在讲解的时候再次渗透方法。3.学生的书写也容易忽略。因为上生字词基本上一课时完成，既要抓过关又要抓重难点生字的笔画笔顺间架结构，感觉时间不够用。只能依靠学生一二年级积累的书写经验和对写作业
electron 下载过慢解决阿雷由开发 electron
elecetron起步根据elecetron官网上，试了下初始安装，结果第一步安装依赖就挂了2个命令都试过了不行npminstall--save-develectronyarnadd--develectron安装cnpm命令npminstall-gcnpm--registry=https://registry.npm.taobao.org还是回到cnpm吧，最少他告诉你进度条有有了进度条，最少知道
并发编程原理与实战（十八）ReentrantLock API全面解析
上一篇讲解了Lock接口核心API和相比于synchronized的关键优势，本文来进一步学习Lock接口的具体实现类ReentrantLock。认识ReentrantLock基本行为和语义下面我们先看ReentrantLock的定义。/***Areentrantmutualexclusion{@linkLock}withthesamebasic*behaviorandsemanticsasthe
并发编程原理与实战（九）限流利器信号量的最佳实践分析帧栈 Java并发编程 java
系统掌握并发编程系列（一）精准理解线程的创建和停止系统掌握并发编程系列（二）详解Thread类的主要属性和方法系统掌握并发编程系列（三）一步步剖析线程返回值系统掌握并发编程系列（四）详细分析传统并发协同方式（synchronized与wait()notify()）系统掌握并发编程系列（五）讲透传统并发协同方式伪唤醒与加锁失效问题系统掌握并发编程系列（六）详细讲解并发协同利器CountDownLat
侧耳倾听温暖的佳佳
可能很多人都不知道，能和所有人沟通的秘诀，不是多么擅长表达，而是善于倾听，今天我们来分享三个倾听要点。被尊重。我们有个误区，觉得认真听别人说话，不时点头微笑，注视他的眼睛，就是倾听。其实倾听不在于有多投入，而在于你到底从对方的话中听到了什么，只有听到感受和需求，并且给予对方期待的回应，他才能感觉到被尊重。被理解。回应对方，他未必能感觉到被理解，因为如果方法不对的话，回应只会适得其反。要别人感觉你理
大语言模型应用指南：网页实时浏览 AGI大模型与大数据研究院 AI大模型应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：网页实时浏览作者：禅与计算机程序设计艺术1.背景介绍1.1大语言模型的崛起1.1.1自然语言处理的发展历程1.1.2Transformer模型的突破1.1.3预训练语言模型的优势1.2网页浏览的痛点1.2.1信息过载与检索困难1.2.2内容理解与知识提取1.2.3个性化与智能化需求1.3大语言模型与网页浏览的结合1.3.1智能问答与对话系统1.3.2知识图谱与语义搜索1.3.3
对王晓阳战友文章的点评专注执行
文章人生最重要的投资和选择链接http://mp.weixin.qq.com/s/VqNUQeXxWLdPkWXp-iRvPg金句投资的第一步是投资大脑和认知，第二步就是把自己认知到的东西写出来做一下复盘，加深自己的投资逻辑，写着写着你的思考会特别的清晰，第三步就是训练你的价值感，绝对不能在投资这条路上碰运气，这三步很重要，因为它增加了你投资成功的概率。点评战友你好！这篇文章对于很多人的投资认知是
做幸福的富翁~感恩+欣赏日记9.11（72/100）魏薇天赋解读
『感恩日记』1.感恩队友无限次提议去爬长城，今天终于去了，人生第一次，也克服了自己内心的恐惧。2.感恩网络，有很多攻略，帮助我们节省路程时间，更轻松一些。3.感恩家附近有很多好吃的，玩了一天好累，可以有很多选择，不用再回家做饭『欣赏日记』1.我爱和欣赏自己今天在一次一次的放弃后，最终坚持下来，原来回归当下，每一步都没有很难。2.我爱和欣赏老公，因为儿子全程让抱，于是他几乎抱着爬了全程。3.我爱和欣
《金文成〈中庸〉学习笔记399。2020-2-22》金吾生
《金文成〈中庸〉学习笔记399。2020-2-22》今天是庚子年戊寅月乙未日，正月廿九，2020年2月22日星期六。【唯天下至诚，为能尽其性；能尽其性，则能尽人之性；能尽人之性，则能尽物之性；能尽物之性，则可以赞天地之化育；可以赞天地之化育，则可以与天地参矣。】上一节，船山讲到诚与性的关系，诚是第二性的，性是第一性的，该怎么理解呢？船山说：“诚者性之撰也，性者诚之所丽也”，意思是说，不能简单地将诚
成年人，六一快乐存一瓶清气
作为一个被岁月定义的成年人你每天起床还期待着什么吗？就像当初期待六一儿童节的到来。单纯地期待着不多的糖果，或者能多拿点零花钱。期待与伙伴的游戏，期待那一天不用上课，不用写作业。玻璃弹珠在一定程度上可以成为我们“货币”，五毛钱一包的辣条爱不释手，老师讲课的声音总是影响到我们思考宇宙（发呆），每天傍晚无聊的新闻联播等到长大还是没等到大结局，无法理解它唠唠叨叨，怎么就会得到大人的青睐呢？你是在什么时候长
分享高效背诵单词的方法落笔情深i
图片发自App如何一天刷掉1000多个单词？我对背单词效率高的理解是，在同等时间内，过单词的数量比别人的多，且记忆的效果比别人的好。即单位时间内，既有数量又有质量。当年在准备各种标化考试时，我每天都需要背很多单词。到备考后期，我可以每天刷1000多个左右的单词（含背过待巩固的）。以下我分享自己背单词的经验，包括自己走过哪些弯路，又是如何走出这些弯路。希望能帮到大家。1.要有合理的预期弯路：记得我背
出租车智能4G视频监控管理解决方案索迪迈科技车载监控录像机人工智能客流统计计算机视觉远程监控
一、方案背景随着城市交通的不断发展，出租车作为城市公共交通的重要组成部分，其运营安全和服务质量备受关注。为了加强对出租车的管理，提高运营安全性，提升服务质量，同时保障乘客和司机的合法权益，建立一套高效的出租车视频监控管理系统具有重要意义。二、系统概述本出租车视频监控管理解决方案旨在通过在出租车上安装视频监控设备，实现对车辆内外情况的实时监控、录像存储、数据传输以及远程管理。系统主要由车载终端设备、
吸引力法则人生即修行
我们的生活中有时真的有心想事成、梦想成真的事情发生，也许我们自己也很惊奇、无法理解，但这其实就是宇宙的吸引力定律。我们所遭受的一切，不管是好的，还是坏的，其实都是我们自己吸引来的。吸引力定律---七个秘密法则1、一切都是你吸引来的。2、感恩是人类内心中最深沉、最能快速激发出正面情绪的一股源源不绝的能量！3、宇宙能给你所要的一切。宇宙只负责接收你给他的订单，然后帮你实现它。4、改变情绪的三个重点是：
2022-09-20 清空妙有
有时以为没懂的是别人，最后发现没搞懂的是自己。不知道别人，不理解的点在哪里。笑他人可笑，最终是自己可笑，当遇到没看懂的问题，一定要仔细看几遍，再回复。今天和很久未见面也未聊天的朋友聊了会天。我们认识的时候是11年。现在已经过去11年了。她好像一点都没变，画着她喜欢的风格的画，听着她喜欢的风格的音乐。时间好像未曾打扰过她。一直是那个静静的，慢慢的女孩，守护着自己的初心是那么独特她决定继续画画，很开心
DDD深度解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域驱动设计核心解析 Java开发廖志伟 Java场景面试宝典 Domain-Driven Design Software Architecture Strategic and Tactical Design
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
ShardingSphere技术解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他