wx5e2559231090a

百分点认知智能实验室出品：深度迁移学习十八问

编者按

深度迁移学习是基于深度神经网络的迁移学习方法，BERT通过预训练模型达到深度迁移学习的效果，自从2018年底BERT横空出世以来，就以势不可挡的姿态横扫了众多榜单，甚至在阅读理解任务SQuAD 中超越人类水平。BERT在公检法、媒体出版、军工、快消零售等工业界也迅速落地，如百分点智能对话系统、百分点智能审校系统和百分点智能翻译系统等。BERT几乎在所有的下游任务中效果都获得了明显提升，BERT自此开创了一个NLP的新时代，那就是pre-train + fine-tuning的时代。

基于BERT的各种改进版预训练模型层出不穷，令人眼花缭乱，似乎一不小心就会落伍。但是万变不离其宗，只要掌握了一些最基本的的思想、技术，就能让自己紧跟大神们的脚步，让更优秀的算法模型在工业界持续落地。百分点认知智能实验室梳理了以BERT为代表的基于fine-tuning模式的深度迁移学习中一些疑难问题，整理出18个典型的问题，对理解BERT论文和源代码有明显的帮助，因此分享给大家。

本文作者：崔丙剑苏海波

基本概念

1.如何正确理解深度迁移学习？

答：迁移学习是机器学习的一个重要分支，是指利用数据、任务、或模型之间的相似性，将在源领域学习过的模型，应用于新领域的一种学习过程。

图1: 迁移学习示意图

迁移学习主要有几种形式：基于样本的迁移、基于特征的迁移、基于模型的迁移和基于关系的迁移。重点说下基于模型的迁移，其基本思想是指从源域和目标域中找到他们之间共享的参数信息，以实现迁移。

图2: 基于模型的迁移学习

深度迁移学习主要就是模型的迁移，一个最简单最常用的方法就是fine-tuning，就是利用别人已经训练好的网络，针对目标任务再进行调整。近年来大火的BERT、GPT、XLNET等都是首先在大量语料上进行预训练，然后在目标任务上进行fine-tuning。

预训练方法中基于特征的方法与基于微调的方法本质区别在哪里？

答：特征提取（Feature-extract）：特征提取是使用之前训练好的模型对新的样本生成特征向量，然后将这些特征作为task-specific模型的输入，训练新的模型参数。比如BERT就是之前学好的模型，把一个句子输入到BERT，可以得到这个句子的向量表示，然后将这个向量作为后续的比如分类模型的输入，在训练的过程中只训练后面的分类模型，BERT的输出仅仅是作为分类模型的输入特征。

模型微调（Fine-tuning）：不同于特征提取的方式要另起灶炉针对具体任务设计新的模型，模型微调是直接使用已训练好的模型，针对当前的任务对输出层简单修改，然后在当前任务的数据上进行训练，对部分网络层的参数进行微调，让模型更适合当前的任务。这种模型微调的方式能充分利用深度神经网络强大的泛化能力，还避免了设计新的的模型，无需从头开始训练，能达到更快的收敛速度和更好的效果。

模型输入

BERT的输入有三个embedding，各自的作用是什么？

答：BERT embedding layer有三个输入，分别是token-embedding、segment-embedding和position-embedding。

Token-embedding：将单词转换为固定维的向量表示形式，在BERT-base中，每个单词都表示为一个768维的向量。

Segment-embedding：BERT在解决双句分类任务（如判断两段文本在语义上是否相似）时是直接把这两段文本拼接起来输入到模型中，那么模型是如何区分这两段文本呢，答案就是通过segment-embedding。对于两个句子，第一个句子的segment-embedding部分全是0，第二个句子的segment-embedding部分全是1。

Position-embedding：BERT使用transformer编码器，通过self-attention机制学习句子的表征，self-attention不关注token的位置信息，所以为了能让transformer学习到token的位置信息，在输入时增加了position-embedding。

BERT的输入有token-embedding、segment-embedding和position- embedding三个向量，三者之间是拼接的关系还是相加的关系，维度分别是多少？

答：三个向量是相加后作为第一层transformer的输入，三个向量的维度都是768。Pytorch版BERT-embedding具体实现代码如下，从中我们可以明显看出是相加的关系。

图3: BERT embedding层源码

BERT的position-embedding为什么是通过学习出来的而不像transformer那样通过sinusoidal函数生成？

答：BERT论文中作者对此没有说明原因，不过可以从以下几点进行分析：

a) 用于机器翻译的平行语料有限，transformer那篇论文在做机器翻译任务时没有像现在训练BERT⼀样海量的训练数据，所以即使⽤了learned-position-embedding也未必能够学到⼀个好的表⽰。⽽BERT训练的数据⽐transformer⼤的多，因此可以让模型⾃⼰去学习位置特征。

b) 对于翻译任务，encoder的核⼼任务是提取完整的句⼦语义信息，无需特别关注某个词的具体位置。而BERT在做下游的序列标注类任务时需要确切的位置信息，模型需要给出每个位置的预测结果，因此BERT在预训练过程中需要建模完整的词序信息。

BERT分词时使用的是wordpiece，wordpiece实现了什么功能，为什么要这么做？

答：先说为什么这么做，如果以传统的方式进行分词，由于单词存在时态、单复数等多种变化会导致词表非常大，严重影响训练速度，并且即使一个非常大的词表仍无法处理未登录词（OOV， Out Of Vocabulary），影响训练效果。而如果以character级别进行文本表示粒度又太细。Subword粒度在word与character之间，能够较好的解决上述分词方式面临的问题，已成为了一个重要的NLP模型性能提升方法。Subword的实现方式主要有wordpiece和BPE(Byte Pair Encoding)，BERT使用了wordpiece方式。

Wordpiece的功能：Wordpiece可以理解为把⼀个单词再拆分成subword，比如"loved","loving", "loves"这三个单词，其实本⾝的语义都是“爱”，但是如果以单词为单位，那这些词就算是不⼀样的词。Wordpiece算法能够把这3个单词拆分成"lov", "#ed", "#ing", "#es"几部分，这些单词都有一个共同的subword“lov”，这样可以把词的本⾝的意思和前缀、后缀分开，使最终的词表变得精简，并且寓意也能更清晰。

BERT的词汇表是怎么生成的？

答：可能很多人没思考过这个问题，虽然在上一个问题中我们已经知道wordpiece会把单词拆分成subword，但是能拆分的前提是有一个subword词汇表。这个问题中我们就来详细看下这个subword词汇表的生成方法。

将wordpiece词汇表生成之前我们还是先看下BPE词汇表是怎么生成的，因为两者非常相似。

BPE词汇表生成算法如下：

a) 准备训练语料用于生成subword词表，需要量足够大；

b) 预设定好期望的subword词表的大小；

c) 将单词拆分为字符序列并在末尾添加后缀“ ”，统计单词频率，例如“ low”的频率为5，那么我们将其改写为“ l o w ”: 5。这一阶段的subword的粒度是单字符；

d) 统计连续字节对出现的频率，选择频率最高的合并成新的subword；

e) 重复第4步，直到subword词表大小达到第2步设定的值，或下一个最高频的字节对出现频率为1。

下边来看一个例子：假设我们的训练语料为：

lower出现2次，newest出现6次，widest出现3次，low出现5次

根据上述第3步的操作可以处理成如下格式：

{'l o w e r ': 2, 'n e w e s t': 6, 'w i d e s t ': 3, 'l o w ': 5}

其中的key是词表中的单词拆分成字母，末尾添加后缀“”，value代表单词出现的频率。此时初始的词表中是训练语料中所有单词的字母集合，大小为10，如下表：

[l, o, w, e, r, n, s, t, i, d]

我们设定最终的词表大小为18，然后开始整个算法中最重要的是第4步，过程如下：

原始词表: {'l o w e r ': 2, 'n e w e s t ': 6, 'w i d e s t ': 3, 'l o w ': 5}

出现最频繁的序列: ('s', 't') 9

将”st”加入词表，第1次循环结束，此时词表大小为11；

合并最频繁的序列后的词表: {'n e w e st ': 6, 'l o w e r ': 2, 'w i d e st ': 3, 'l o w ': 5}

出现最频繁的序列: ('e', 'st') 9

将”est”加入词表，第2次循环结束，此时词表大小为12；

合并最频繁的序列后的词表: {'l o w e r ': 2, 'l o w ': 5, 'w i d est ': 3, 'n e w est ': 6}

出现最频繁的序列: ('est', '') 9

将“est”加入词表，第3次循环结束，此时词表大小为13；

合并最频繁的序列后的词表: {'w i d est': 3, 'l o w e r ': 2, 'n e w est': 6, 'l o w ': 5}

出现最频繁的序列: ('l', 'o') 7

将“lo”加入词表，第4次循环结束，此时词表大小为14；

合并最频繁的序列后的词表: {'w i d est': 3, 'lo w e r ': 2, 'n e w est': 6, 'lo w ': 5}

出现最频繁的序列: ('lo', 'w') 7

将“low”加入词表，第5次循环结束，此时词表大小为15；

合并最频繁的序列后的词表: {'w i d est': 3, 'low e r ': 2, 'n e w est': 6, 'low ': 5}

出现最频繁的序列: ('n', 'e') 6

将“ne”加入词表，第6次循环结束，此时词表大小为16；

合并最频繁的序列后的词表: {'w i d est': 3, 'low e r ': 2, 'ne w est': 6, 'low ': 5}

出现最频繁的序列: ('w', 'est') 6

将“west”加入词表，第7次循环结束，此时词表大小为17；

合并最频繁的序列后的词表: {'w i d est': 3, 'low e r ': 2, 'ne west': 6, 'low ': 5}

出现最频繁的序列: ('ne', 'west') 6

将“newest”加入词表，第8次循环结束，此时词表大小为18，整个循环结束。

最终我们得到的词表为：

[l, o, w, e, r, n, s, t, i, d, st, est,est, lo, low, ne, west, newest]

Wordpiece与BPE稍有不同，主要区别在于BPE是通过最高频率来确定下一个subword，而wordpiece是基于概率生成新的subword，另一个小的区别是wordpiece后缀添加的是“##”而不是“<\w>”，整个算法过程如下：

a)准备训练语料用于生成subword词表，需要量足够大；

b)预设定好期望的subword词表大小；

c)将单词拆分为字符序列并在末尾添加后缀“##”；

d)从所有可能的subword单元中选择加入语言模型后能最大程度地增加训练数据概率的组合作为新的单元；

e)重复第4步，直到subword词表大小达到第2步中设定的值，或概率增量低于某一阈值。

BERT的输入token-embedding为什么要在头部添加"[CLS]"标志？

答：CLS是classification的缩写，添加该标志主要用于句子级别的分类任务。BERT借鉴了GPT的做法，在句子首部增加一个特殊的token“[CLS]”，在NSP预训练任务中，就取的是“[CLS]”位置对应的最后的隐状态，然后接一个MLP输出两个句子是否是上下句关系。可以认为“[CLS]”位置的信息包含了句子类别的重要特征。同理可以取“[MASK]”位置的向量用于预测这个位置的词是什么。

BERT输入的长度限制为512，那么如何处理长文本？

答：BERT由于position-embedding的限制只能处理最长512个词的句子。如果文本长度超过512，有以下几种方式进行处理：

a）直接截断：从长文本中截取一部分，具体截取哪些片段需要观察数据，如新闻数据一般第一段比较重要就可以截取前边部分；

b）抽取重要片段：抽取长文本的关键句子作为摘要，然后进入BERT；

c）分段：把长文本分成几段，每段经过BERT之后再进行拼接或求平均或者接入其他网络如lstm。

模型原理

Attention机制相比CNN、RNN有什么样的优势？为什么？

答：在传统的seq2seq模型中，我们一般使用RNN或CNN对序列进行编码，然后采用pooling操作或者直接取RNN的终态作为输入部分的语义编码C，然后把C输入到解码模块中，在解码过程中，C对每个位置的输出重要程度是一致的，如下图所示：

图4: 普通的seq2seq

然而在自然语言中，一个句子中不同部分的重要性也是不一样的，用RNN或CNN进行句子编码，并不能学习到这样的信息。因此出现了attention，顾名思义就是在解码时能对序列中不同位置分配一个不同的注意力权重，抽取出更加关键和重要的信息，从而使模型做出更好的判断，就像我们人在看一个句子时，重点关注的是其中的重要信息，对不重要的信息根本不关心或基本不关心。

图5: 基于attention的seq2seq

BERT使用multi-head attention机制， multi-head的输出是如何拼接在一起的？维度大小是多少？

答：mutli-head attention的计算过程如下图所示：

图6: Multi-head attention计算过程

输入向量维度为768维，经过每个self-attention后得到隐层输出为64维，然后把12个输出拼接起来得到768维的向量。

BERT MLM（Masked Language Model）任务具体训练方法为：随机遮住15%的单词作为训练样本，其中80%用“[MASK]” 来代替，10%用随机的一个词来替换，10%保持这个词不变。这么做的目的是什么？

答：要弄明白为什么这样构造MLM的训练数据，我们需要首先搞明白什么是MLM、为什么要使用MLM，以及MLM存在哪些问题。

a）为什么使用MLM：传统的语言模型一般都是单向的，要同时获取上下文信息的常见做法是分别训练正向与反向的语言模型，然后再做ensemble，但这种做法并不能充分利用上下文信息。MLM 的意义在于能够真正利用双向的信息，使模型学习到上下文相关的表征。具体做法就是随机屏蔽（mask）输入文本中的部分token，类似于完形填空，这样在预测被mask部分的token时就能够同时利用上下文信息。

b）MLM存在问题：由于预训练数据中存在“[MASK]”这个token，而在实际的下游任务中对BERT进行fine-tuning时，数据中没有“[MASK]”，这样就导致预训练模型使用的数据和fine-tuning任务使用的数据不一致，会影响fine-tuning的效果。

为了让MLM能够学习上下文相关特征，同时又尽量避免pre-train和fine-tuning数据不一致的问题，数据处理时就采取题目中策略，具体处理策略和原因解释如下：

BERT的参数量如何计算？

答：要计算BERT的参数量，首先需要对BERT的结构了解的非常清楚，下面我们就来看下base版BERT 110M的参数到底是怎么计算出来的。

图7: BERT结构图

a) embedding层的参数
BERT的输入有三种embedding，如下源码中所示：

图8: BERT embedding层源码

vocab_size=30522，hidden_size为768，最大位置长度为512，type_vocab_size=2，因此可以计算出：

embedding层的参数量 =(30522+512+2)*768=23,835,648

b) multi-headattention的参数

图9: Self attention计算过程

先来看下multi-head attention的计算过程：embedding层的输出x分别与三个矩阵WQ、Wk、Wv相乘得到Q、K、V，再经过右上图的计算得到一个self-attention的输出，12个self-attention的输出拼接起来得到，再经过一个线性变换得到multi-head attention的输出。

WQ、Wk、Wv的维度均为76864，head数为12，线性变换矩阵为768768，因此可以计算出：

multi-head的参数量 =76864312+768768=2,359,296

c) 全连接层（FeedForward）的参数量
全连接层把multi-head attention输出的维度从768映射到3072又映射到768，公式如下图所示：

其中W1维度为7683072，W2维度为3072768，因此可以计算出：

全连接层的参数量 = 76830722=4,718,592

Base版BERT使用了12层transformer的encoder，因此可以计算出：

总参数量 = embedding参数量+12（multi-headattention参数量+全连接参数量）
=23,835,648+12*(2,359,296+4,718,592)=108,770,304≈110M

BERT基于NSP和MLM两个任务进⾏预训练，如果对BERT进⾏改进，⼀个可⾏的⽅向就是增加更多的预训练任务，那么除了这两个任务之外，还可以增加哪些预训练任务呢？

答：⾸先这些预训练任务的训练数据要能从⽆监督的数据中获取，这样才能获取到海量的训练数据，符合这⼀条件的任务都可以进⾏尝试，如百度的ERNIE增加了很多个预训练任务，相比于原始BERT有了明显的提升。几个有代表性的预训练任务如下：

Knowledge Masking Task：BERT的MLM任务中是对句⼦中单个的token进⾏mask，可以对于句⼦中的短语和命名实体进⾏mask。

Capitalization Prediction Task：预测单词是否⼤写，与其他词语相⽐，⼤写词语通常具有特定的语义价值。

Token-Document Relation Prediction Task：预测⼀个段落中的某个token是否出现在原始⽂档的其他段落中。根据经验，在⽂档不同部分都出现的单词通常是⽂档的关键词，因此这⼀任务可以在⼀定程度上使模型能够捕获文档的关键字。

Sentence Distance Task：⼀个学习句⼦间距离的任务，该任务被建模为⼀个3类分类问题，“0”表示两个句⼦在同⼀个文档中相邻，“1”表示两个句⼦在同⼀个文档中，但不相邻，“2”表示两个句子来自两个不同的文档。

模型的进化

15.自回归语言模型（AR, Autoregressive LM）与自编码语言模型（AE, Autoencoder LM）的区别？

答：自回归语言模型：根据上文内容预测下一个单词或者根据下文内容预测上一个单词，这样单向的语言模型就是自回归语言模型。LSTM、GPT、ELMO都是自回归语言模型。自回归语言模型的缺点，是不能同时利用上下文信息。

自编码语言模型：自编码器是一种通过无监督方式学习特征的方法，用神经网络把输入变成一个低维的特征，这就是编码部分，然后再用一个解码器把特征恢复成原始的信号，这就是解码部分。具体到语言模型中，BERT使用的MLM就是自编码语言模型，对一些token进行mask，然后拿被mask位置的向量（包含了上下文的信息）来预测该位置真正的token。

自编码语言模型的优点就是可以同时利用上下文信息，缺点就是预训练阶段和fine-tuning阶段使用的训练数据不一致，因为fine-tuning阶段的数据是不会被mask的。

16.XLNET相对于BERT做了哪些重要改进？

答：BERT的AE语言模型虽然能同时学习上下文信息但是会导致预训练数据和fine-tuning阶段的数据不一致从而影响fine-tuning的效果。而XLNET的思路就是使用AR语言模型，根据上文预测下文，但是在上文中添加了下文信息，这样既解决了BERT面临的问题也同时利用了上下文信息。

XLNET改进后的语言模型叫做PermutationLanguage Model（PLM），其重点就是permutation，用一个例子来解释：对于一个输入句子X=[x1, x2, x3, x4]，我们希望预测x3，在正常的输入中通过AR语言模型只能看到x1和x2。为了在预测x3时能看到x4，XLNET的操作是固定x3的位置，然后把其它的词进行随机排列，得到如：[x4, x1, x3, x2]，[x1, x4, x3, x2]等数据，这样就可以使用单向的AR语言模型来学习双向信息。

这时有人可能就会有疑问：就算训练时可以对输入句子进行排列组合，但是fine-tuning时没法这样做啊。没错，fine-tuning阶段确实不能对输入做排列，只能输入原始句子，所以XLNET在预训练阶段也是不能显示地对输入进行排列的。为了解决这个问题，XLNET的输入还是原始的句子，只不过是在transformer内部利用attention mask来实现的，而无需真正修改句子中词语的顺序。例如原来的句子是X=[x1, x2, x3, x4]，如果随机生成的序列是[x3, x2, x4,x1]，但输入到 XLNET 的句子仍然是[x1, x2,x3, x4]，此时设置attention mask如下图：

图10: Attention mask示意图

图中的掩码矩阵，白色表示不遮掩，黑色表示遮掩。第 1 行表示 x1 的掩码，因为x1是句子的最后一个 token，因此可以看到之前的所有 token [x3,x2,x4]；第2行是x2的掩码，因为x2是句子的第二个token，所以能看到前一个token x3；第3行、第4行同理。这样就实现了尽管当前输入看上去仍然是[x1, x2, x3, x4]，但是已经改成排列组合的另外一个顺序[x3, x2,x4, x1]了。如果用这个例子用来从左到右训练LM，意味着当预测x2的时候，它只能看到上文x3；当预测x4的时候，只能看到上文x3和x2，……

17.RoBERTa相对于BERT做了哪些重要改进？

答：RoBERTa相对于BERT在模型结构上并没有改变，改进的是预训练方法，主要改进有以下几点：

a) 静态mask变为动态mask
BERT MLM任务中，有15%的样本在预处理阶段会进行一次随机mask，具体的mask方式参考问题12，然后在整个训练过程中，这15%的被mask的样本其mask方式就不再变化，也不会有新的被mask样本，这就是静态mask。

RoBERTa采用了一种动态mask的方式，它并没有在预处理的时候对样本进行mask，而是在每次向模型提供输入时动态生成mask，所以训练样本是时刻变化的，并且实验表明这种动态mask的方式要比BERT原始的静态mask效果要好。

b) 去除NSP任务
很多实验表明NSP任务的没多大意义，RoBERTa中去除了该任务，不过在生成数据时也做了一些改进，原始的BERT中是选择同一篇文章中连续的两个句子或不同文章中的两个句子，而RoBERTa的输入是连续的多个句子（总长度不超过512）。

c) 更多的数据、更大的mini-batch、更长的训练时间
BERT base的训练语料为13G，batch-size为256，而RoBERTa的训练语料扩大了10到130G，训练中batch-size为8000，实为大力出奇迹的杰出代表。

18.ALBERT相对于BERT做了哪些重要改进？

答：ALBERT是一个精简的BERT，参数量得到了明显的降低，使得BERT的大规模应用成为可能。相对于BERT，ALBERT主要有三点改进：

a) Embedding matrix因式分解
在BERT、XLNET等模型中，embedding的维度 E 和隐藏层维度 H 是相等的，都是768，V是词表的大小一般的3万左右。从建模的角度来说，embedding层的目标是学习上下文无关的表示，而隐藏层的目标是学习上下文相关的表示，理论上来说隐藏层的表述包含的信息应该更多一些，因此应该让H>>E。如果像BERT那样让E=H，那增大H之后，embedding matrix大小V*H会变的很大。

ALBERT采取因式分解的方式来降低参数量，先将单词映射到一个低维的embedding空间，然后再将其映射到高维的隐藏空间，让H>>E，这样就可以把embedding matrix的维度从O(VH)减小到O(VE+E*H)，参数量减少非常明显。

b) 跨层权重共享
Transformer参数共享可以只共享全连接层、只共享attention层，ALBERT结合了这两种方式，让全连接层与attention层都进行参数共享，也就是说共享encoder内的所有参数，采用该方案后效果下降的并不多，但是参数量减少了很多，训练速度也提升了很多。此外实验还表明ALBERT每一层的输出embedding相比于BERT来说震荡幅度更小一些，可以增加模型的鲁棒性。

c) 修改预训练任务NSP为SOP
一些研究表明BERT的NSP并不适合用于预训练任务，原因可能是负样本来源于不同的文档，模型在判断两个句子的关系时不仅考虑了两个句子之间的连贯性，还会考虑两个句子的话题，而两篇文档的话题通常不同，模型可能更多的通过话题去分析两个句子的关系，而不是连贯性，这使得NSP任务变的相对简单。

ALBERT中设计了SOP(Sentence-orderprediction)任务，其正样本选取方式与BERT一致（来自同一文档的两个连续句子），而负样本也同样是选自同一文档的两个连续句子，但交换了两个句子的顺序，从而使模型可以更多地建模句子之间的连贯性而不是句子的话题。

参考文献：br/>1.http://jd92.wang/assets/files/transfer_learning_tutorial_wjd.pdf
2.https://jalammar.github.io/illustrated-transformer/
3.https://medium.com/@_init_/why-BERT-has-3-embedding-layers-and-their-implementation-details-9c261108e28a
4.https://medium.com/@makcedward/how-subword-helps-on-your-nlp-model-83dd1b836f46
5.BERT Explained: State ofthe art language model for NLP.
https://towardsdatascience.com/BERT-explained-state-of-the-art-language-model-for-nlp-f8b21a9b6270
6.https://zhuanlan.zhihu.com/p/70257427
7.https://arxiv.org/pdf/1706.03762
8.https://arxiv.org/pdf/1906.08237
9.https://arxiv.org/pdf/1907.11692
10.https://arxiv.org/pdf/1909.11942
11.https://arxiv.org/pdf/1905.07129

你可能感兴趣的:(深度迁移学习,bert)

交叉熵损失函数（Cross-Entropy Loss）我叫罗泽南深度学习人工智能
原理交叉熵损失函数是深度学习中分类问题常用的损失函数，特别适用于多分类问题。它通过度量预测分布与真实分布之间的差异，来衡量模型输出的准确性。交叉熵的数学公式交叉熵的定义如下：CrossEntroyLoss=−∑i=1Nyi⋅log(y^i)\begin{equation}CrossEntroyLoss=-\sum_{i=1}^{N}y_i\cdotlog(\hat{y}_i)\end{equati
MySQL 核心知识全面解析：从事务到索引的深度探索 guihong004 java面试题 mysql 数据库
1.事务隔离级别有哪些?MySQL的默认隔离级别是?事务隔离级别是数据库系统中用于控制不同事务之间的交互和可见性的机制。SQL标准定义了四个隔离级别，按照从低到高的顺序分别是：读未提交（ReadUncommitted）：在这个级别，一个事务可以读取另一个尚未提交的事务的数据更改。这会导致脏读（DirtyRead），即读取到未提交的数据。读已提交（ReadCommitted）：这个级别确保一个事务只
AI大模型引领医疗变革：十大创新应用场景塑造智慧医疗新时代和老莫一起学AI 人工智能自动化数据库学习语言模型大模型
前言在人工智能技术的迅猛发展中，AI大模型以其无与伦比的数据处理能力和深度学习能力，正逐步成为医疗健康领域变革的引领者。本文旨在深入探讨AI大模型在医疗领域的十大创新应用场景，展示其如何显著提升医疗服务效率、赋能临床决策，并推动整个行业向智能化转型。一、智能化诊疗：精准辅助，提升诊断效率AI大模型凭借对海量医疗数据的深度分析，能够协助医生进行更为精准的诊断。例如，百度灵医大模型凭借强大的数据处理能
技术文档的精髓：规划布局、语言表达与更新维护重庆钢铁侠经验分享
本文将从技术文档的规划布局、语言表达以及更新与维护三个方面入手，探讨如何打造一份出色的技术文档，确保信息的系统性、连贯性以及时效性。一：技术文档的规划布局1.1确定文档的整体架构技术文档的规划布局是确保信息呈现系统性和连贯性的关键。首先，需要确定文档的整体架构，这包括章节设置和逻辑顺序。一个好的架构应该能够清晰地指导读者从入门到精通。章节设置：根据文档的目的和受众，合理设置章节。例如，对于深度学习
你能读懂微服务架构深度解析：架构设计背后的哲学吗？写代码的珏秒秒程序员 Java 编程 java 架构程序人生后端微服务
架构设计哲学如果说软件开发的本质是不断挖掘问题领域中隐藏的错综复杂性，那么架构解决的问题就是如何管理这些复杂性。而在软件领域，最为复杂的软件实体莫过于软件操作系统。从数以千计的工程师参与开发的UNIX操作系统到Linux开源系统的成功，越来越多的人开始关注和思考UNIX技术背后隐藏的设计哲学。UNIX设计哲学概括为一句话就是“小而专注”。可以说，微服务架构理念和UNIX设计哲学一脉相承，微服务将U
无需插件，OmniGen 凭文本指令读懂图像，多样生成随心掌控算家云模型构建 python 开发语言 AI模型图像生成文字转图像人工智能 OmniGen
一、介绍OmniGen是一个统一的图像生成模型，可用于执行各种任务，包括但不限于文本到图像生成、主题驱动生成、身份保留生成、图像编辑和图像条件生成。OmniGen不需要额外的插件或操作，它可以根据文本提示自动识别输入图像中的特征（例如，所需的对象、人体姿势、深度映射）可以通过OmniGen灵活地控制图像生成：引用表达式生成：你可以输入多个图像，并使用简单的通用语言来引用这些图像中的对象。OmniG
“AI 自动化效能评估系统：开启企业高效发展新征程上海拔俗网络 java 团队开发
在当今数字化飞速发展的时代，企业面临着日益激烈的市场竞争，如何提升效率、降低成本成为了企业生存与发展的关键。AI自动化效能评估系统应运而生，它如同一把智能钥匙，为企业开启了高效发展的新征程。AI自动化效能评估系统，简单来说，就是利用人工智能技术对企业的各项业务流程、生产环节以及员工工作表现等进行全方位、自动化的评估。它能够快速收集海量的数据，并通过先进的算法模型对这些数据进行深度分析，从而精准地判
基于深度学习的推荐系统构建：Movielens 数据集 fresh的转码之路深度学习人工智能机器学习推荐算法
基于深度学习的推荐系统构建：Movielens数据集依赖环境代码语言：python3.11.5开发平台：pycharmtensorflow版本：2.18.0MovieLen1M数据及简介MovieLens1M数据集包含包含6000个用户在近4000部电影上的100万条评分，也包括电影元数据信息和用户属性信息。下载地址为：http://files.grouplens.org/datasets/mov
智能体（AI Agent）：概念、原理与应用，全面解析AI技术前沿! 和老莫一起学AI 人工智能学习数据库产品经理机器学习 ai 大模型
一、智能体概念的深度剖析1.1智能体（Agent）的本质智能体，作为人工智能领域的一颗璀璨明珠，是那些能够主动感知周遭环境、自主决策并付诸实践的系统实体。它们不仅拥有自主性、交互性、反应灵敏及高度适应性等鲜明特征，更在复杂多变的情境中展现出卓越的自我管理与任务执行能力。智能体的诞生，标志着人工智能技术从机械式的规则遵循迈向了更为灵活、智能的自主决策新时代。智能体的核心精髓在于其内置的学习与决策引擎
Fluss 与数据湖的深度解析（二）大圣数据星球大数据 Flink 设计模式
上一篇文章中我们说了Fluss与Paimon数据湖的三个相关问题：如何查询Paimon数据湖中的数据？如何查询Fluss和Paimon数据的“联合视图”？如何只查询Fluss中的数据？大家可以先去看这一篇文章，其中第二点如何查询Fluss和Paimon数据的“联合视图”中还遗留一个问题：在做数据查询的时候Fluss和Paimon数据湖是怎么保证数据一致性的，也就是事务的。还有第三点如何只查询Flu
海外抖音技术深度解析：算法、AI与全球化的挑战神探阿航计算机产业科普与思考算法人工智能机器学习数据挖掘深度学习
引言2025年1月19日，在美国宣布暂停服务，这一事件引发了全球用户的广泛关注。作为全球最受欢迎的短视频平台之一，其成功离不开其强大的技术支撑，尤其是其个性化推荐算法和AI驱动的创作工具。然而，随着全球市场环境的变化，它面临的技术与运营挑战也日益凸显。本文将深入分析其技术核心、全球化运营中的挑战及其未来发展方向。核心：个性化推荐引擎其算法是其成功的关键，其核心在于个性化推荐引擎。该引擎采用深度学习
YOLOv8与Transformer：探索目标检测的新架构 AI架构设计之禅 AI大模型应用入门实战与进阶大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
YOLOv8与Transformer：探索目标检测的新架构关键词：目标检测，深度学习，YOLOv8，Transformer，计算机视觉，卷积神经网络摘要：目标检测是计算机视觉领域的一项重要任务，其目标是从图像或视频中识别和定位特定对象。近年来，YOLO（YouOnlyLookOnce）系列算法以其高精度和高速度成为目标检测领域的佼佼者。最新版本的YOLOv8引入了Transformer架构，进一步
【强化学习】PyTorch-RL框架大雨淅淅人工智能 pytorch 人工智能 python 深度学习机器学习
目录一、框架简介二、核心功能三、学习环境配置四、学习资源五、实践与应用六、常见问题与解决方案七、深入理解强化学习概念八、构建自己的强化学习环境九、调试与优化十、参与社区与持续学习一、框架简介PyTorch-RL是一个基于PyTorch框架的深度强化学习项目。它充分利用了PyTorch的强大功能，提供了易于使用且高效的深度强化学习算法实现。该项目的主要编程语言是Python，旨在帮助开发者快速实现和
图像生成大模型：Imagen 详解转角再相遇 imagen python 深度学习计算机视觉
近年来，图像生成技术取得了显著进展，推动了计算机视觉和生成对抗网络（GAN）等领域的发展。Imagen是一个新兴的图像生成大模型，其在生成高质量、逼真图像方面表现出色。本文将详细讲解Imagen的基本原理、架构、训练流程及应用场景。1.Imagen的基本原理1.1什么是Imagen？Imagen是一种基于深度学习的图像生成模型，结合了自注意力机制（Self-attentionMechanism）和
凸优化学习 qiaoxinyu10623 凸优化 1024程序员节
认为学习凸优化理论比较合适的路径是：学习/复习线性代数和（少量）高等数学的知识。实际上，凸优化理论综合使用了线性代数和微积分的相关知识，比如方向导数，雅克比矩阵，海森矩阵，KKT条件等。这里强烈推荐MIT公开课《线性代数》，GilbertStrang教授主讲，完全不是照本宣科，而是注重几何解释，非常具有启发性，学完之后，你会对线性代数有全新的认识。学习视频：-UP主汉语配音-【线性代数的本质】合集
【MySQL】Mysql数据库导入导出sql文件、备份数据库、迁移数据库程序员洲洲数据库数据库 mysql 导入导出sql sql文件备份迁移
本文摘要：本文提出了xxx的实用开发小技巧。作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。同时欢迎大家关注其他专栏，我将分享Web前后端开发、人工智能、机器学习、深度学习从0到1系列文章。同时洲洲已经建立了程序员技术交流群，如果您感兴趣，可以私信我加入我的社群，也可以直接vx联系（文末有名片）v：bdizztt随时
::v-deep的理解记得早睡~ vue.js 前端 javascript
vue样式穿透在刚开始使用element-ui组件库时，想要修改其内部的样式，但总是不生效，通过查询资料，了解到了深度作用选择器。如果希望scoped样式中的一个选择器能够作用得“更深”，例如影响子组件，可以使用>>>操作符：.a>>>.b{width:100%;height:100%;background:red;}但是像scss等预处理器却无法解析>>>，所以我们使用下面的方式：.a{/dee
实战千问2大模型第五天——VLLM 运行 Qwen2-VL-7B（多模态）学术菜鸟小晨千问多模型 qwen2 vl
一、简介VLLM是一种高效的深度学习推理库，通过PagedAttention算法有效管理大语言模型的注意力内存，其特点包括24倍的吞吐提升和3.5倍的TGI性能，无需修改模型结构，专门设计用于加速大规模语言模型（LLM）的推理过程。它通过优化显存管理、支持大模型的批处理推理以及减少不必要的内存占用，来提高多GPU环境下的推理速度和效率。VLLM的核心特点包括：显存高效性：VLLM能够动态管理显存，
qwenvl 代码中的attention pool 注意力池如何理解，attention pool注意力池是什么？ OpenSani AI 大模型计算机视觉语言模型 qwenvl LLM
qwenvl中的attentionpool如何理解，其实这就是一个概念的问题看qwenvl的huggingface的代码的时候，发现代码里有一个Resampler以及attn_pool，这和之前理解的连接池线程池表示资源复用的意思不太一样，查了一下：注意这里的pool和线程池连接池里面的pool不一样:深度学习中的池化：池化在深度学习中主要指通过滑动窗口对特征图进行下采样，提取最重要的特征，减少计
解锁SQL递归查询：WITH RECURSIVE的深度解析 2401_85762266 sql 数据库
标题：解锁SQL递归查询：WITHRECURSIVE的深度解析在数据的层级结构中探索，犹如穿梭于迷宫，每个节点都可能隐藏着通往更深层次的路径。SQL的WITHRECURSIVE正是我们手中的阿莉阿德涅之线，引领我们深入数据的每一个角落。本文将详细解读WITHRECURSIVE的神秘力量，通过实际代码示例，展示如何使用这一强大的递归查询功能。一、WITHRECURSIVE的魔法起源WITHRECUR
计算机视觉与深度学习：使用深度学习训练基于视觉的车辆检测器（MATLAB源码-Faster R-CNN） ZhShy23 javascript 深度学习
在人工智能领域，计算机视觉是一个重要且充满活力的研究方向。它使计算机能够理解和分析图像和视频数据，从而做出有意义的决策。其中，目标检测是计算机视觉中的一项关键技术，它旨在识别并定位图像中的多个目标对象。车辆检测作为目标检测的一个重要应用，在自动驾驶、智能交通系统等领域有着广泛的应用前景。本文将介绍如何使用MATLAB和深度学习技术，特别是FasterR-CNN模型，来训练一个车辆检测器。文章目录一
GAN在图像增强中的应用实战指南码字仙子
本文还有配套的精品资源，点击获取简介：图像增强技术通过算法改善图像质量，GAN作为一种生成对抗网络，在此领域具有重要应用。通过生成器和判别器的对抗性训练，GAN可以生成逼真图像、修复低质量图像、扩增数据集并进行风格迁移。本项目将介绍如何使用Python及其相关库实现GAN图像增强，包括模型的构建、训练和评估。通过项目案例学习，你可以掌握GAN在图像增强中的实际应用，提高图像处理和深度学习的技能。1
【Python】已解决：WARNING: pip is configured with locations that require TLS/SSL, however the ssl module i 屿小夏 python pip ssl
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习模型推理速度/吞吐量计算(附代码） Scabbards_ 1500深度学习笔记深度学习人工智能
参考博文：https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247546551&idx=2&sn=f198b6365e11f0a18832ff1203302632&chksm=ebb70e63dcc0877569d1838b2391744be628bf6cbb6e203a49f855e0769ecbbbf5a9929fe2db&scene
PyTorch使用教程- Tensor包 Loving_enjoy 论文 pytorch 人工智能
###PyTorch使用教程-Tensor包PyTorch是一个流行的深度学习框架，它提供了一个易于使用的API来创建和操作张量（Tensors）。张量是一个多维数组，类似于NumPy中的ndarray，但它是基于GPU的，支持自动求导。本文将详细介绍PyTorch中的Tensor包，包括张量的创建、运算、形状变换、索引与切片、以及重要的张量处理方式。####一、张量的创建在PyTorch中，可以
ChatGPT详解 Loving_enjoy 实用技巧人工智能自然语言处理
ChatGPT是一款由OpenAI研发和维护的先进的自然语言处理模型（NLP），全名为ChatGenerativePre-trainedTransformer，于2022年11月30日发布。以下是对ChatGPT的详细介绍：###一、技术架构与原理1.**技术架构**：ChatGPT建立在Transformer架构之上，这是一种深度学习模型，特别适用于处理自然语言。其核心是自注意力机制，允许模型在
Fluss 与数据湖的深度解析（二） java
上一篇文章中我们说了Fluss与Paimon数据湖的三个相关问题：如何查询Paimon数据湖中的数据？如何查询Fluss和Paimon数据的“联合视图”？如何只查询Fluss中的数据？大家可以先去看这一篇文章，其中第二点如何查询Fluss和Paimon数据的“联合视图”中还遗留一个问题：在做数据查询的时候Fluss和Paimon数据湖是怎么保证数据一致性的，也就是事务的。还有第三点如何只查询Flu
AI绘画工具介绍编程小郭 ai作画
市面上AI绘画工具众多，它们利用深度学习和图像处理技术，为用户提供了丰富的创作体验和可能性。以下是对几款主流AI绘画工具的详细介绍及横向对比：一、主流AI绘画工具介绍Midjourney简介：Midjourney是一个独立的研究实验室，专注于人工智能绘图，被广泛应用于设计、艺术创作、广告制作等领域。特点：以其强大的图像生成能力和跨界融合的创新特点著称，能够根据文本描述和视觉输入生成兼具故事性与视觉
文心一言vsGPT-4全面对比编程小郭文心一言 chatgpt java python 人工智能 ai
文心一言和GPT-4都是当前非常先进的人工智能语言模型，它们各自具有独特的特点和优势。以下是对这两款工具的全面比较：文心一言是由百度开发的一款大型人工智能语言模型，它基于强大的深度学习技术和海量的数据资源，具备出色的语言理解和生成能力。文心一言在中文处理方面尤为出色，能够准确理解中文语境和语义，生成流畅、自然的中文文本。文心一言还具备丰富的知识库和推理能力，能够回答各种问题，提供有用的信息和建议。
摆脱焦虑，释放大脑——GTD（Get Things Done）的核心与深度实践 Qingzong_MA 职场小白进阶篇职场和发展
在我们的日常工作中，总会有那么一刻，突然间产生强烈的焦虑感：明明有一件重要的事还没做，然而它又像消失在时光流转中的迷雾一样，让人抓不住。你知道它很重要，可它却摆脱了大脑的捕捉，像空气一样无形、无声。一旦在老板的晨会上被点名，心头的五雷轰顶刹那间提醒了你：“原来是这个！”这种记忆的疏忽，正是许多人管理时间的最大障碍。无论是灵感的闪现，还是老板交代的琐碎任务，脑海中的瞬时遗忘都成为我们面临的最真实困境
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj