Raphael9900

【学习】numpy、self-supervised learning自监督学习

李宏毅机器学习和numpy基础

一、numpy
- 1、NumPy Ndarray 对象
- 2、NumPy 数据类型
- 3、NumPy 数组属性
- 4、NumPy 创建数组
- - numpy.empty
  - numpy.zeros
  - numpy.ones
- 5、NumPy 从已有的数组创建数组
- - numpy.asarray
  - numpy.frombuffer
  - numpy.fromiter
- 6、NumPy 从数值范围创建数组
- - numpy.arange
  - numpy.linspace
  - numpy.logspace
  - NumPy 切片和索引
二、self-supervised learning 自监督学习
- 1、self-supervised learning
- - supervised
  - self-supervised
  - （1）输入掩码（masking input）
  - （2）next sentence prediction
  - BERT怎么用呢？
  - GLUE
  - 使用BERT
  - 预训练一个seq2seq的模型
  - why does BERT work？
  - multi-lingual BERT

一、numpy

1、NumPy Ndarray 对象

ndarray 的内部结构:

跨度可以是负数，这样会使数组在内存中后向移动，切片中 obj[::-1] 或 obj[:,::-1] 就是如此。
创建一个 ndarray 只需调用 NumPy 的 array 函数即可：

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

import numpy as np
a = np.array([1, 2, 3], dtype = complex)
print (a)

输出：[1.+0.j 2.+0.j 3.+0.j]

2、NumPy 数据类型

数据类型对象 (dtype)
dtype 对象是使用以下语法构造的：

numpy.dtype(object, align, copy)

object - 要转换为的数据类型对象
align - 如果为 true，填充字段使其类似 C 的结构体。
copy - 复制 dtype 对象，如果为 false，则是对内置数据类型对象的引用

3、NumPy 数组属性

axis=0，表示沿着第 0 轴进行操作，即对每一列进行操作；axis=1，表示沿着第1轴进行操作，即对每一行进行操作。NumPy 数组的维数称为秩（rank）。在 NumPy中，每一个线性的数组称为是一个轴（axis），也就是维度（dimensions）。
NumPy 的数组中比较重要 ndarray 对象属性有：

import numpy as np
a = np.array([[1,2,3],[4,5,6]])
a.shape = (3,2) 或者是b = a.reshape(3,2)
print (a) 或者是print(b)

输出：
[[1 2]
[3 4]
[5 6]]

ndarray.itemsize
以字节的形式返回数组中每一个元素的大小。

例如，一个元素类型为 float64 的数组 itemsize 属性值为 8(float64 占用 64 个 bits，每个字节长度为 8，所以 64/8，占用 8 个字节），又如，一个元素类型为 complex32 的数组 item 属性为 4（32/8）。

ndarray.flags

4、NumPy 创建数组

ndarray 数组除了可以使用底层 ndarray 构造器来创建外，也可以通过以下几种方式来创建。

numpy.empty

numpy.empty 方法用来创建一个指定形状（shape）、数据类型（dtype）且未初始化的数组：

numpy.empty(shape, dtype = float, order = ‘C’)

import numpy as np
x = np.empty([3,2], dtype = int)
print (x)

输出：
[[ 6917529027641081856 5764616291768666155]
[ 6917529027641081859 -5764598754299804209]
[ 4497473538 844429428932120]]
#数组元素为随机值，因为它们未初始化。

numpy.zeros

创建指定大小的数组，数组元素以 0 来填充：

numpy.zeros(shape, dtype = float, order = ‘C’)

import numpy as np
#默认为浮点数
x = np.zeros(5)
print(x)
#设置类型为整数
y = np.zeros((5,), dtype = int)
print(y)
#自定义类型
z = np.zeros((2,2), dtype = [(‘x’, ‘i4’), (‘y’, ‘i4’)])
print(z)

输出：
[0. 0. 0. 0. 0.]
[0 0 0 0 0]
[[(0, 0) (0, 0)]
[(0, 0) (0, 0)]]

numpy.ones

创建指定形状的数组，数组元素以 1 来填充：

numpy.ones(shape, dtype = None, order = ‘C’)

5、NumPy 从已有的数组创建数组

numpy.asarray

numpy.asarray 类似 numpy.array

numpy.asarray(a, dtype = None, order = None)

x = [1,2,3] #列表
x = (1,2,3) #元祖
x = [(1,2,3),(4,5)] #元祖列表

numpy.frombuffer

numpy.frombuffer 用于实现动态数组。

numpy.frombuffer 接受 buffer 输入参数，以流的形式读入转化成 ndarray 对象。

numpy.frombuffer(buffer, dtype = float, count = -1, offset = 0)

numpy.fromiter

numpy.fromiter 方法从可迭代对象中建立 ndarray 对象，返回一维数组。

numpy.fromiter(iterable, dtype, count=-1)

import numpy as np
#使用 range 函数创建列表对象
list=range(5)
it=iter(list)
#使用迭代器创建 ndarray
x=np.fromiter(it, dtype=float)
print(x)

輸出：[0. 1. 2. 3. 4.]

6、NumPy 从数值范围创建数组

numpy.arange

numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象，函数格式如下：

numpy.arange(start, stop, step, dtype)

import numpy as np
x = np.arange(5)
print (x)

输出：
[0 1 2 3 4]

import numpy as np
x = np.arange(10,20,2)
print (x)

输出：[10 12 14 16 18]

numpy.linspace

numpy.linspace 函数用于创建一个一维数组，数组是一个等差数列构成的，格式如下：

np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

import numpy as np
a = np.linspace(1,10,10)
print(a)

输出：[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]

import numpy as np
a = np.linspace(1,1,10)
print(a)

输出：[1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]

numpy.logspace

numpy.logspace 函数用于创建一个于等比数列。格式如下：

np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)

import numpy as np
a = np.logspace(0,9,10,base=2)
print (a)

输出：[ 1. 2. 4. 8. 16. 32. 64. 128. 256. 512.]

NumPy 切片和索引

ndarray对象的内容可以通过索引或切片来访问和修改，与 Python 中 list 的切片操作一样。

ndarray 数组可以基于 0 - n 的下标进行索引，切片对象可以通过内置的 slice 函数，并设置 start, stop 及 step 参数进行，从原数组中切割出一个新数组。

import numpy as np
a = np.arange(10)
s = slice(2,7,2) # 从索引 2 开始到索引 7 停止，间隔为2
print (a[s])

輸出：[2 4 6]

也可以通过冒号分隔切片参数 start:stop:step 来进行切片操作：

import numpy as np
a = np.arange(10)
b = a[2:7:2] # 从索引 2 开始到索引 7 停止，间隔为 2
print(b)

输出：[2 4 6]

冒号 : 的解释：如果只放置一个参数，如 [2]，将返回与该索引相对应的单个元素。如果为 [2:]，表示从该索引开始以后的所有项都将被提取。如果使用了两个参数，如 [2:7]，那么则提取两个索引(不包括停止索引)之间的项。

import numpy as np
a = np.array([[1,2,3],[3,4,5],[4,5,6]])
print(a)
#从某个索引处开始切割
print(‘从数组索引 a[1:] 处开始切割’)
print(a[1:])

输出：
[[1 2 3]
[3 4 5]
[4 5 6]]
从数组索引 a[1:] 处开始切割
[[3 4 5]
[4 5 6]]

切片还可以包括省略号 …，来使选择元组的长度与数组的维度相同。如果在行位置使用省略号，它将返回包含行中元素的 ndarray。

import numpy as np
a = np.array([[1,2,3],[3,4,5],[4,5,6]])
print (a[…,1]) # 第2列元素
print (a[1,…]) # 第2行元素
print (a[…,1:]) # 第2列及剩下的所有元素

输出:
[2 4 5]
[3 4 5]
[[2 3]
[4 5]
[5 6]]

二、self-supervised learning 自监督学习

自监督学习的一个很大的模型是BERT，有340M 的参数。除此之外还有下面的模型，都比BERT大。

GPT-3有175B的参数。

1、self-supervised learning

supervised

假如我们要输入一篇文章x训练我们的模型，模型输出y。我们有标注label y^和y进行对比，这种方法就是有监督的。

self-supervised

假如我们有一篇无标注的文章x，我们让x分成两部分（x’‘和x’），一部分x’作为模型的输入，另外一部分x’‘作为模型的标注。模型根据输入x’输出y，我们希望y和label x’'越接近越好。这种没有label的学习就是无监督的自监督学习。

BERT做的事情是以下两个：

（1）输入掩码（masking input）

其实bert模型是一个transformer encoder，在这里用在自然语言处理作为例子。BERT的输入是“台湾大学”，之后我们随机对一个输入（“湾”）进行掩码（Randomly masking some tokens）。Token是我们处理一段文字的单位。在这里我们把中文的一个字当成一个token。我们这里进行掩码的操作有两种方法。第一种方法是换成mask（一种特殊的符号，是一种新的字，在字典里面没有出现过）。另外一种方法是随机找一个字代替。在bert模型里面，他随机选择决定用哪一个字进行掩码，以上的两种掩码方式都可以用。在里面输入之后会输出向量序列。对于掩码之后产生的向量，会进行linear的操作（与一个矩阵相乘），然后经过softmax得到输出分布（这个分布是一个非常长的向量，里面有所有的字，每个字都对应一个分数）。

我在接下来你要怎么训练这个BERT呢？BERT不知道被盖起来的是什么字，所以学习的目标就是：输出跟ground truth（真实数据，1-of-hot 向量）越接近越好（最小化交叉熵）。

BERT与Linear一起训练，以确定输出是什么字。除了masking，BERT还做另外的事情：

（2）next sentence prediction

从资料库里面的拿两个句子出来，然后在这两个句子中间加入一个特殊的符号（[SEP]）代表分隔（区分两个句子）。还会在最前面，整个sequence的最前面，加入一个特别的符号（[CLS]）。把这个处理完的序列输入BERT里面，看[CLS]对应的输出。他要做的是一个类似二元分类问题，要预测的就是yes or no。这个意思指的是什么呢？就是要预测说这两个句子是不是相接的，如果这两个句子是相接的，他就要训练成看到两个相接的句子就输出yes，看到两个不是相接的句子就输出no。就这样但是后来的研究发现说next sentence prediction对于接下来的事情其实帮助不大。在一篇叫做robustly optimized BERT approach 的论文里面，它的缩写是RoBERTa，就是明确是指是说他尝试了做next sentence prediction这个方法，但是没有什么特别的帮助。接下来会有更多文章说没有用，。他没有用的一个可能是next sentence prediction这个任务可能太简单了，要知道两个句子该不该被接在一起，也许是不是一个特别难的任务。做法就是你先随机选择，接下来选接在他后面的句子，或者是从整个资料库里面随便选一句，那通常随便选一句，跟你一开始选的这一句一定很不像。所以BERT没有借由这一个任务学到太多有用的东西。那后来还有另外一个方法，跟next sentence prediction有点像，大家在文件上看起来是比较有用的，叫做SOP。这个方法是说：我们找出来的句子可能本来就是接在一起的，只是你可能会把本来放在前面的那个句子当和放在后面的那个句子顺序弄反了。可能这个问题比较难，所以 sop目在文件上看起来是有用的。那他被用在一个叫做albert，就是BERT进阶的版本。

BERT怎么用呢？

BERT会做的事情是什么？我们训练的时候就会叫BERT学两个任务，一个是盖住一些词汇，他可以把盖住的部分补回来，知道怎么做填空题。另外一个是它可以预测两个句子是不是应该被接在一起，但这招好像没有什么用，那所以整体而言不能真正学到是什么。他就是学到怎么做填空那好像是不够的！如果我要解的任务不是填空题的话，BERT有什么用呢？我们可以去教会一个模型做填空题以后，然后BERT可以被用在其他的任务上，即使这些任务跟填空题不一定要有关，甚至是根本就没有什么关系，但是可以被用在这些任务上。BERT真正被使用的任务叫做downstream tasks（实际上真正在意的任务）。BERT学会做这些任务的时候，还是需要有一些标准的资料（labeled data）。BERT学到之后就可以分化成各式各样的任务，这叫做微调（fine-tune）。在产生BERT之前的就叫预训练（pre-train）。

GLUE

要测试一个自监督学习模型的能力，通常会把它测试在多个任务上BERT可以经过微调处理各式各样的任务，所以我们通常不只会测试他在一个任务上的能力。在一个任务集合里面，最知名的一个标杆就叫做GLUE，它是general language understanding的缩写。GLUE里面总共有九个任务。我们让BERT经过微调后去做多个不同的任务，看看他在每个任务上得到的正确率是多少，再取一个平均值，得到一个分数，这个分数代表了这个自监督学习模型的好坏。

在这个图上，横轴是不同的模型，很多都是BERT的变种。黑色的线代表的是人类在这个任务上得到正确率（1）。本来九个任务里面只有一个是机器做的比人好，后来随着越来越多技术被提出来，就有另外三个任务可以做的很好。当然这只是在这一个资料集上面的结果，并不代表说机器超越了人类，他是在这个资料集上超越了人类。这显示的是什么呢？机器对这个资料集玩坏了。接下来有人做了进阶版的资料集。

使用BERT

第一个情况
假设我们的下游任务是输入一个序列，输出一个类别，这是一个分类的问题。比如说给机器的句子，要去判断说这个句子是正面的还是负面。那对于BERT而言，他怎么解sentiment analysis的问题呢？
给他一个句子，就是你要拿来sentiment analysis的那一个，然后把这个句子前面一个[CLS]的token，把这个序列输入到BERT里面，去看【CLS】的部分，然后通过linear决定新出类别是什么？正面还是负面。做的时候需要有下游任务的标注，也就是说BERT并没有办法凭空去解一个问题，你仍然需要提供的一些标注的资料给他。比如大量的句子和每一个句子是正面的还是负面的标注，才能够去训练BERT。linear的部分跟都会用radiant decent做。在训练模型的时候，不是会随机初始化一个参数吗？然后用great descent去调那个参数。linear的参数是随机初始化的。但是BERT的参数不再是完全随机初始化，我们是直接把那个学会了做填空题的BERT的参数拿来初始化BERT，事实上这样做的结果会比较好。

有趣的地方是，这个图上有各式各样的任务，随着epoch的增加，训练的loss会降低。在图中，我们有已经进行预训练的模型（fine-tune微调）和随机初始化参数（scratch）的模型。随机初始化参数的模型用虚线，而预训练的模型用实线。在图中可以看出来，进行过预训练的模型的loss下降的比较快，大约在2 epochs就可以下降到零附近。而随机初始化参数的模型会花比较多的时间才能练到较低的loss，而且有些模型即使到了20 epochs也不能训练到跟有预训练模型的相同的水平。

像bert这种模型，它是不是semi-supervised或者unsupervised的模型呢？都是。因为要把BERT应用到下游任务上，下游任务需要有标注的资料。在做预训练的时候用了大量没有标注的资料，但下游任务有少量有标注的资料，所以合起来是semi-supervised半监督学习。

第二个情况

第二个情况是输入一个序列，输出另外一个相同长度的序列。什么样的任务是输入跟输出长度一样的呢？比如说词性标注（POS tagging），你给机器一个句子，机器输出每一个词汇对应的词性。BERT怎么处理这种问题呢？你就给输入一个句子，这个句子里面的每一个token（每个字）有一个对应的向量。经过BERT和linear之后输出每一个词汇属于哪一个类别。这里跟跟一般的分类问题不同的是，我们的BERT不是经过随机选取参数的，而是通过预训练来选取参数的。

第三个情况
输入两个句子，输出一个类别。这边举的都是自然语言处理的例子，也可以把这些例子改成语音的例子或影像的例子。不管是语音还是文字，都可以看作是一排向量。最常见的是natural language inference的例子，缩写是NLI。什么是natural language inference做的事情呢？他要做的是：给机器两个句子，一个句子叫做promise（前提），另外一个句子叫做hypothesis（假设）。机器要做的事情就是，从这个前提能不能够得到这个假设，这个前提是否跟这个假设矛盾。在这个例子里面，我们的前提是有一个人他骑着一个马，然后他跳过了一个坏掉的飞机。这个句子是从一个基础语言库里面拿出来的。假设是这个人在一个小餐馆里面。是吗？不是，这个是矛盾（contradiction）的。所以机器要做的事情就是输入句子，得出这两个句子之间的关系（contradiction、entailment、neutral）。像这样子的任务啊其实很常见，可以用在立场分析里面。

bert怎么解决这个问题呢？
输入两个句子，两个句子中间放一个特殊的符号[SEP]，最前面再放[CLS]这个符号，经过BERT输出也会给我们另外一个序列。但是我们只取[CLS]这个部分送到linear里面，然后决定输出什么样的类别。这跟之前是一样的，需要一些标注的资料才有办法训练这个模型，BERT部分不再是随机初始化的而是用预训练模型的参数初始化的。

第四个情况
输入一个问题，输出答案。BERT也可以应用在QA问题上。但是这边这个问答不是一般的问答，它是稍微有点限制的问答，这种问答是extraction-base QA，也就是说答案一定出现在文章里面。在这个任务里面，我们的输入有文章（document）和问题（query），不管是文章还是问题，他都是一个序列。如果是中文的话，每一个d就代表了一个中文的字，每一个q也代表了一个中文文字。把Q和D输入到QA模型里面，输出两个正整数s和e。根据这两个正整数直接从文章里面截一个段落出来就是答案。意思就是说从这个文章里面的第s个字到第e个字，串起来就是正确答案。这个其实是今天非常标准的做法，就是我第一次听到说做这个五六年前第一次听到说做QA的时候居然是读一篇文章，给一个问题输出两个正整数就是答案。现在有一篇文章有一个问题，那机器怎么输出问题的正确答案的？看下图

BERT也是取经过预训练的模型的参数的。怎么用BERT解QA的问题呢？这个解法是这个样子的，文章跟问题中间有一个特殊的符号[SEP]，前面有个[CLS],把这个序列放到BERT输入。那在这整个任务里面，唯一需要使用随机初始化参数的只有两个向量，这边用橙色的向量跟蓝色的向量来表示，这两个向量长度跟BERT的输出长度是一样的。那接下来呢怎么使用这两个向量呢？先把橙色的拿出来，分别跟对应到文章这个部分所输出的向量。文章那边输入三个token，这边就输出三个向量，把这三个向量都跟橙色的这个向量做一个内积算出三个数字。接下来我得到三个数字，接下来看哪里分数最高。中间的向量得到分数最高吗？那s=2表示文章的起始的位置为2的就是输出了。蓝色的向量也做一模一样的事情，输出代表结束的位置。

理论上BERT的模型的输入没有长度限制，因为BERT的模型是一个transfomer encoder。但是实际上不能输入很长的序列，因为需要做self-attention（计算量很大）。最长可能就在512了。

我们能不能做一个BERT来处理“填空题”的问题呢？这个真的是没办法做，自己训练不起来。当初最早设计BERT的Google用的资料量也已经非常精准，他的资料量有三个billion的词汇。实验室有个助教试图自己训练ALBERT-base（BERT的升级版），所以在这个图上面，纵轴代表的是GLUE的分数，横轴就是训练的过程。助教用TPU训练了1M十万次用了八天。

为什么要自己把它做出来，为什么我们要自己训练一个BERT呢？这些模型都是公开的，我们自己训练一个，而且结果跟谷歌的BERT差不多，到底有什么意义呢？这边想要做的事情，其实是想要建立bert的胚胎学。是什么意思呢？我知道BERT的训练过程，需要耗费非常大的运算资源。所以我们想要知道有没有什么可能去节省这个运算资源，想要知道怎么让他训练更快一点，也许我们可以从观察他的训练过程开始。过去从来没有人观察过BERT的训练过程，因为谷歌直接告诉你他在各个任务上都做的很好，那实际上在训练的过程中到底学到了什么事情？这个过程中他什么时候学会填动词，什么时候学会填名词，什么时候学会填代名词，没有人去研究过这件事情。我们自己训练了一个BERT以后，我们就可以观察BERT在什么时候学会填什么样的词汇，知道它的填空的能力是怎么增进的。得到的结论跟我们想象的是不太一样的。

预训练一个seq2seq的模型

刚才讲的那些任务都没有包括seq2seq model，那如果我们今天要做的任务是seq2seq model怎么办呢？Bert其实也可以预训练decoder。有一个seq2seq model，输入一串句子，输出是一串句子，中间cross attention连接在一起。我们给encoder的输入增加干扰噪声，使得输出的结果不是原来的结果。然后decoder希望输出的句子跟干扰前是一模一样的，看到弄坏的结果，然后要输出还原弄坏前的结果。

那怎么干扰呢？就有各种不同的方法，有一个方法叫做MASS，里面就说这个弄坏的方法就跟BERT一样，把一些地方盖起来。那后来还有各式各样弄坏的方法，比如说把一些词汇删掉，把输入的数据弄乱，词汇的顺序做一个旋转，然后还有同时盖住和删掉的方法，然后再请seq2seq model把它还原回来。有一篇论文r叫做BART，他就是把这些方法一股脑的都用上去，发现都用所有的方法可能结果是更好。

有这么多干扰的方法，哪种方法比较好呢？谷歌都帮你做完了，有一篇论文叫做T5（transfer text-to-text transformer），T5做了各式各样的尝试，长达67页。T5训练在一个叫C4（colossal clean crawled corpus）的数据集上，C4是非常大的。

why does BERT work？

为什么BERT会有用呢？
常见的解释方法：输入一串文字，每一个文字都有个对应的向量，这个向量叫做embedding（代表了每个字的意思）。比如说输入台湾大学，输出四个向量，这四个向量分别就代表台湾大学。相似意思的token会有相似的embedding。更具体而言是假设你把这些字对应的向量把它画出来，发现意思越相近的字他们的向量就越接近。比如草跟果是植物，他们的向量就比较接近。但是中文有一字多义的问题，Bert它可以考虑上下文，所以同一个字，比如说都是果这个字，它的上下文不同，它的向量是不会样。可以吃的苹果的果跟苹果手机的果这两个果统统都是果，但是根据上下文它的意思不同，所以它的向量对应的分布就非常不一样。

接下来就看真实的例子。
假设我们现在就考虑果这个字，那我们就收集很多有提到果这个字的句子，比如说喝苹果汁，苹果电脑等等。那我们把这些句子都丢到BERT里面，再去计算每一个果所对应的embedding。下面的两个果不一样，因为这是一个encoder（里面含有self-attention），所以根据我上下文的不同，得到向量会不一样。接下来我们计算这些果之间的余弦相似度（cosine）得到的结果。

这边选了十个句子，观察得到的结果。前五个句子里面的果都代表了可以吃的苹果，后五个句子代表苹果手机的果。这边有十个组，两两之间。会得到embedding的余弦相似度。偏黄色代表相似度大，前五个组上相似度比较高，后五个组之间的相似度也比较高，但是他们分别求相似度就低。也就是说BERT能够分辨这两种果的语义。

输出来的向量，每个向量代表了那个词的意思。所以说bert在训练做填空题的过程中，他学会了每一个中文字有什么样的意思，Bert也许真的了解了中文的意思。对他来说，每个中文的符号不再是没有关系的，他了解了中文的意思，所以他可以在接下来的任务做的更好。为什么我们说这些向量可以代表那个字的意思呢？我们是基于一个科学的假设。也就是1960年代的一个语言学家提出来的，我们需要看一段文字的上下文，才能知道这个词汇的意思。BERT在做的事情就是在学会做填空题的过程中去查看上下文来抽取信息，最后得到输出。在下面的例子中，我们从w1w3w4中抽取信息分析w2是什么，然后bert就能预测w2。过去有一个技术跟bert很像，叫word embedding，可以根据上下文得到中间。但是它是只有两层transformer。为什么不用更多的transformer或者用CNN呢？因为那时候的计算量比较小。但是bert能做到很高的计算量。他就能理解出上下文的意思得到这个词的embedding，能区分一个相同的词在具有不同的上下文的时候有不一样的意思，这种叫contextualized word embedding。

我们把训练在文字上的BERT拿来做蛋白质的分类，DNA的分类或者是音乐的分类。我们就拿DNA的分类做例子吧，dna就是一连串去氧核糖核酸，去氧核糖核酸有四种分别用C\T\A\G来表示。我们要做DNA分类的问题，就是给一串DNA，要决定这个DNA属于什么类型。一个分类的问题，label资料训练下去就结束了。

把组成DNA序列的四个基本脱氧核糖核酸用ATCG表示。然后我们把atcg分别赋予不同的含义，如下，然后在句子前面加上[CLS]输入到bert里面，经过linear输出一个class。在这里我们的bert是经过预训练的，而linear是随机参数初始化的。

然后一下做了一个实验，蛋白质、DNA和音乐分别用词汇来表示。有四个模型一起做实验，可以发现在BERT里面，我们的结果是非常好的。

虽然不知道为什么，但是BERT确实是很好的。就算给他是乱七八糟的东西，他也能训练的很好。

multi-lingual BERT

接下来有一个multi-lingual bert，我们可以用不同国家的语言去训练这个模型。

这个模型用104种语言来训练。如果我们用英语做问答训练的例子来训练这个模型的话，它就能自动用中文的问答测试（预训练是104中语言参与的，但是它只会做填空，然后做了微调之后只用一种语言训练就能做另外一种语言的QA测试）。人类也只能到93.3%。

也许在看过大量语言过程中学会了同样意思不同语言之间embedding的关系。

MRR越高越好。

自己训练是数据量是不是太多了？增加数据之后：前面没有变化，但是后面会下降！资料量是需要的！

虽然他会用不同的语言测试，但是实际上BERT还是知道不同语言的符号的。

不同语言之间确实有一个差异，这里是举例中文和英文的：如果输入中文，如果我们假设这个差异，就能得到中文的意思。

虽然翻译的不是很准确，但是不同语言之间的信息还是藏在多语言BERT里面的。

你可能感兴趣的:(numpy,学习,python)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交