京东云技术团队

ChatGPT 是如何产生心智的？ | 京东云技术团队

一、前言 - ChatGPT真的产生心智了吗？

来自斯坦福大学的最新研究结论，一经发出就造成了学术圈的轰动，“原本认为是人类独有的心智理论（Theory of Mind，ToM），已经出现在ChatGPT背后的AI模型上”。所谓心智理论，就是理解他人或自己心理状态的能力，包括同理心、情绪、意图等。这项研究中，作者发现：davinci-002版本的GPT3已经可以解决70%的心智理论任务，相当于7岁儿童。

.2023 年，面对铺天盖地的 AI 应用，我们人类终于意识到，有一些东西被永远的改变了。但在这波 AI 热潮之中，只有一个应用是真正吓人的——ChatGPT。由于心智无法通过量化评判，但ChatGPT确实满足智能的定义，例如推理、计划、解决问题、抽象思考、理解复杂想法、快速学习。但ChatGPT本质上只做一件事情：续写。当我们给出前N个词汇的时候，如果一个模型能够告诉我们第“N+1”个词汇大概率会是什么，我们就认为模型掌握了语言的基本规律。

为什么光凭“续写”就可以产生智能？以下是摘自知乎的一段回答：

“为什么这么一个简单的接话茬能力让ChatGPT看起来能够解决各种各样的任务呢？因为我们人类大部分的任务都是以语言为载体的。当我们前面说了一些话，它把接下来的话接上，任务就完成了。ChatGPT作为一个大语言模型，目的就是“把话接上”，而把话接上这件事情可以在不知不觉中帮我们完成各种任务。”，这也解释了为什么ChatGPT有时候瞎胡诌，他并没有撒谎，他不知道对错，他只是想把对话顺利进行下去。

如果真的像上述所说，那GPT似乎没有我们想象的神奇，看起来只是一个基于大数据和统计学的语言模型，通过它学习的海量文本预测下一个概率最高的词。就像是有一个容量巨大的“数据库”，所有的回答都是从这个数据库里拿到的。

但奇怪的是，ChatGPT又可以回答他没有学习过的问题，最具代表性的是训练集中不可能存在的六位数加法，这显然无法通过统计学的方式来预测下一个最高概率的数字是多少。

不仅如此，GPT还学习到了在对话中临时学习的能力。

看起来ChatGPT除了“续写”外，还真的产生了逻辑推理能力。这些统计之外的新能力是如何出现的？

如何让机器理解语言，如何让代码存储知识？这篇文章，只是为了回答一个问题：一段代码是如何拥有心智的？

二、Attention is all you need - 注意力机制

搜索所有有关ChatGPT的文章，发现有一个词的出现频率特别高，Attention is all you need。ChatGPT的一切都建立在“注意力机制”之上，GPT的全称是Generative Pre-trained Transformer，而这个transformer就是一个由注意力机制构建的深度学习模型。其来源于2017年的一篇15页的论文，《Attention is all you need》[1]。再结合OpenAI对于GPT2和GPT3的两篇论文[2][3]，我们可以拆开这个大语言模型，看看他在说话的时候究竟发生了什么。

注意力机制的诞生来源于人脑的思维方式，例如在读这段话时，你的注意力会不断的从左往右一个字一个字的闪过，之后再把注意力放到完整的句子上，理解这些字词的关系，其中有些关键词还会投入更多的注意，这一切发生在电光火石之间。

而基于注意力机制的Transformer和GPT系列模型就是在模拟这一思维过程，通过让机器理解一句话中字词之间的关系和意义，完成下一个词的续写，然后再理解一遍，再续写一个词，最后写成一段话。要让程序模仿这件事并不容易。如何让机器计算字符，如何让代码存储知识，为什么将以上模型框架中的一个单元拆开后，全都是圆圈和线？

所以研究AI的第一步，是搞清楚上图中的一个圆圈究竟能够干什么。

2.1 神经元 - 圆圈和线

1957年的一篇论文，《感知器：大脑中信息存储和组织的概率模型》[4]中也出现了一堆圆圈和线，这就是今天各种AI模型的基本单元，我们也叫它神经网络。一个世纪前，科学家就已经知道了人脑大概的运作方式，这些圆圈模拟的是神经元，而线就是把神经元连接起来的突触，传递神经元之间的信号。

将三个神经元连接在一起，就得到了一个开关，要么被激活输出1，要么不被激活输出0。开关可以表达是否，区分黑白，标记同类，但是归根到底都是一件事情，分类。过去几十年，无数个人类最聪明的头脑所做的，就是通过各种方式把这些圆圈连接起来，试图产生智能。

这个网站可以模拟更多的神经元分裂问题。可以看到一个神经元能处理的情况还是太有限了，能分开明显是两块的数据，而内圈外圈的数据就分不开。但如果加入激活函数，再增加新的神经元，每一个新增的神经元都可以在边界上新增一两条折线，更多的折线就可以围得越来越像一个圆，最终完成这个分类。

分类可以解决很多具体问题，假如上图中的每个点的X轴和Y轴分别代表一只小狗的岁数和体重，那么只凭这两种数值就可以分出来这是两个不同品种的狗，每个点代表的信息越多，能解决的问题也就越复杂。比如一张784个像素的照片，就可以用784个数字来表示分类，这些点就能分类图片。更多的线，更多的圆圈，本质上都是为了更好的分类。这就是今天最主流的AI训练方案，基于神经网络的深度学习。

学会了分类，某种程度上也就实现了创造。

这就是为什么有这么多业界学者意识到了深度学习的本质，其实是统计学，沿着圆圈和线的道路，他们终究会到达终点，成为人人都可以使用的工具。而如果拆开GPT系列模型，暴露出来的也仍然只是这些圆圈和线。但分类和统计真的能模仿人的思维吗？在论述之前，先了解一下成语接龙的底层原理。

2.2 成语接龙

在2018年第一代GPT的原始论文[5]中，我们可以看到GPT系列的模型结构。回想上文中提到的注意力机制，这一层被叫做注意力编码层，它的目标就是模仿人的注意力，抽取出话语之间的意义，把12个这样的编码层叠在一起，文字从下面进去，出来的就是GPT预测的下一个词。

比如输入how are you之后，模型会输出下一个单词doing，为什么它会输出doing？接下来我们就得搞明白中间到底发生了什么。

输入how are you后，这三个单词会被转换为3个1024维度的向量，接着每个向量都会加上一个位置信息，表示how是第一个词，are是第二个词，以此类推之后它们会进入第一个注意力编码层，计算后变成三个不一样的1024长的向量，再来到第二层、第三层，一直经过全部的24个注意力编码层的计算处理，仍然得到三个1024长的向量，对下一个词的续写结果就藏在最后一个向量里面。关键的计算就发生在这些注意力编码层，这一层里又可以分成两个结构，先算多头注意力，再算全连接层。注意力层的任务是提取话语间的意义，而全链接层需要对这些意义做出响应，输出存储好的知识。

我们可以先用how做个例子，注意力层里有三个训练好的核心参数KQV，用于计算词语间的关联度，将它们与每个向量相乘后，就能得到how和are的关联度，再通过这种方式计算how和you， how和how的关联度，就能得到三个打分，分数越高意味着它们的关联越重要。之后再让三个分数和三个有效信息相乘再相加，就把how变成了一个新的64个格子的向量，然后对are和you做同样的操作，就得到了三个新的向量。

参与这轮计算的KQV是固定的，而模型里一共有16组不同的KQV，他们分别都会做一轮刚才这样的运算，得到16组不同的输出，这叫做多头注意力，意味着对这句话的16组不同的理解。把它们拼在一起，就得到了和输入相同长度的1024个格子，再乘一个权重矩阵W就进入到了全链接层的计算。

在全连接层里，就是4096个我们熟悉的神经元，它们都还是在做分类的工作。这里的计算是把被注意力层转换后的how向量和这里的每一个神经元都连接在一起，1024个格子里的每一个数字都分别和第一个神经元的连线的权重相乘再相加，这个神经元会输出一个相似度分值，与此同时，每一个神经元都在做类似的操作。只有少数神经元的输出大于零，也就意味着神经元对这个敏感，再连接1024个格子号所对应的向量，就又得到了一个新的向量。之后are和you做类似的计算，就得到了三个和初始长度一样的1024长的格子串，这就是一层注意力编码层内发生的事情。之后的每一层都按照相同的流程在上一层的基础上做进一步的计算，即便每一层都只带来了一点点理解，24层算完以后也是很多理解了，最终还是得到三个向量，每个1024长。而模型要输出的下一个词就基于这最后一个向量，也就是you变换来的向量，把它从1024恢复成0-50256范围的序号，我们就能看到这个序号向量在词表里最接近的值。到这一步就可以说模型算出了how are you之后的下一个词，最有可能是doing。

我们希望模型继续续写，就把这个doing续在how are you后面，转换成四个向量，再输入进模型，重复刚才的流程，再得到下一个词。这样一个接一个，一段话越来越长，直到结束，变成我们看到的一段话，这就是文字接龙的秘密。而ChatGPT也只是把这个续写模型改成了对话界面而已，你提的每一个问题都会像这样成为续写的起点，你们共同完成了一场文字接龙。

2.3 “大”语言模型

刚刚提到的每一层的计算流程长，其实还好，GPT真正吓人的地方是参数量大。GPT1的基本尺寸是768，每一层有超过700万个参数，12层就是1.15亿个参数，在他发布的2018年已经非常大了。我们刚刚拆开的GPT medium基本尺寸是10241，共有24层，每一层有1200万参数，乘起来就是3.5亿参数。而到了ChatGPT用的GPT3的版本，它的参数量是1750亿，层数增加到了96层。GPT4并没有公布它的大小，有媒体猜测它是GPT3的六倍，也就是一万亿参数。这意味着，即便把一张3090显卡的显存变大几百倍，让他能装的下级GPT4，回答一个简单问题可能仍然需要计算40分钟。

拆开这一切，就会发现没有什么惊人的秘密，只有大，文明奇观的那种大，无话可说的那种大，这就是GPT系列的真相，一个“大”语言模型。但是我们还是无法回答为什么这样的模型能够产生智能，以及现在还出现了一个新的问题，为什么参数量非得这么大？

让我们先总结一下目前的已知信息，第一，神经网络只会做一件事情，数据分类，第二，GPT模型里注意力层负责提取话语中的意义，再通过全链接层的神经元输出存储好的知识，第三，GPT说的每一个词都是把对话中的所有词在模型中跑一遍，选择输出概率最高的词。所以，GPT拥有的知识是从哪来的？我们可以在OpenAI的论文中看到ChatGPT的预训练数据集，他们是来自网站、图书、开源代码和维基百科的大约700GB的纯文本，一共是4991个token，相当于86万本西游记。而它的训练过程就是通过自动调整模型里的每一个参数，完成了这些海量文字的续写。

在这个过程中，知识就被存储在了这一个一个的神经元参数里，之后它的上千亿个参数和存储的知识就不再更新了。所以我们使用到的ChatGPT其实是完全静止的，就像一具精致的尸体，它之所以看起来能记住我们刚刚说的话，是因为每输出一个新的词，都要把前面的所有词拿出来再算一遍，所以即便是写在最开头的东西，也能够影响几百个单词之后的续写结果。但这也导致了ChatGPT每轮对话的总词汇量是有上限的，所以GPT不得不限制对话程度。就像是一条只有七秒记忆的天才金鱼。

现在回到前言中提到的问题，为什么ChatGPT可以回答他没有学习过的互联网不存在的问题，例如一个训练数据里不可能存在的六位数加法，这显然无法通过统计学的方式来预测下一个最高概率的数字是多少，这些统计之外的新能力是如何出现的？

今年5月，OpenAI的新研究给了我启发，这篇论文名为《语言模型，可以解释语言模型中的神经元》[6]。简单来说就是用GPT4来解释GPT2。给GPT2输入文本时，模型里的一部分神经元会激活，Open AI让GPT4观察这个过程，猜测这个神经元的功能，再观察更多的文本和神经元，猜测更多的神经元，这样就可以解释GPT2里面每一个神经元的功能，但是还不知道GPT4猜的准不准。验证方法是让GPT4根据这些猜想建立一个仿真模型，模仿GPT2看到文本之后的反应，再和真的GPT2的结果做对比，结果一致率越高，对这个神经元功能的猜测就越准确。OpenAI在这个网站里记录了他们对于每一个神经员的分析结果。

比如我们输入30, 28，就可以看到第30层的第28个神经元的情况。GPT4认为这个神经元关注的是具体时间。下面是各种测试例句，绿色就表示神经元对这个词有反应，绿色越深，反应就越大。可以发现，即便拼写完全不同，但这些模型中间层的神经元也已经可以根据词语和上下文来理解它们的意义了。

但OpenAI也发现，只有那些层数较低的神经元才是容易理解的。这个柱状图里的横坐标是对神经元解释的准确程度，纵坐标是神经元的数量。可以看到，对于前几层的神经元，差不多一半都能做到0.4以上的准确度。但是层数越高，得分低的神经元就越来越多了，大多数神经元还是处在一片迷雾之中。

因为对于语言的理解本来就是难以解释的，比如这样一段对话。对于中文母语的我们来说，很快就能理解这段话的意思，但是对于一个神经网络，只靠几个对“意思”有反应的神经元显然是不够意思。

A：“你这是什么意思？” B：“没什么意思，意思意思。” A：“你这人真有意思。” B：“其实也没有别的意思。” A：“那我就不好意思了。” B：“是我不好意思。”

而GPT似乎理解了这些意思，它是如何做到的？

2.4 Emergence - 涌现

“将万事万物还原为简单基本定律的能力，并不蕴含从这些定律出发，重建整个宇宙的能力。” —— Philip Anderson.

1972年，理论物理学家Philip Anderson在Science发表了一篇名为《More is Different》[7]的论文，奠定了复杂科学的基础，安德森认为：“大量基本粒子的复杂聚集体的行为并不能依据少数粒子的性质作简单外推就能得到理解。取而代之的是在每一复杂性的发展层次之中呈现了全新的性质，从而我认为要理解这些新行为所需要作的研究，就其基础性而言，与其它相比也毫不逊色”。

回顾语言模型的结构，信息是随着注意力编码层不断往上流动的，层数越高的神经元越有能力关注那些复杂抽象的概念和难以言说的隐喻。这篇叫《在干草堆里找神经元》[8]的论文也发现了类似的情况，他们找到了一个专门用来判断语言是否为法语的神经元。如果在小模型当中屏蔽这个神经元，他对法语的理解能力马上会下降，而如果在一个大模型中屏蔽它，可能几乎没什么影响。这意味着在模型变大的过程中，一个单一功能的神经元很可能会分裂出多个适应不同情况的神经元，它们不再那么直白的判断单一问题，进而变得更难。

能理解这就是OpenAI为什么非得把模型搞得这么大的原因，只有足够大才足够抽象，而大到了一定程度，模型甚至会开始出现从未出现过的全新能力。

在这篇名为《大语言模型的涌现能力》的论文中[9]，研究人员对于这些大小不同的语言模型完成了八项新能力的测试。可以看到，他们在变大之前一直都不太行，而一旦大到某个临界点，它突然就行了，开始变成一条上窜的直线，就像是在一瞬间顿悟了一样。

纵观我们的自然和宇宙，一个复杂系统的诞生往往不是线性成长，而是在复杂度积累到某个阈值之后，突然的产生一种新的特质，一种此前从未有特的全新状态，这种现象被称作涌现，Emerge。而这个上千亿参数的大语言模型，好像真的涌现出了一些数据分类之上的新东西。

最近读了《失控》这本书，里面也提到了一个概念叫涌现，可以理解为蜂群智慧。一只蜜蜂是很笨的，但是组成一个群体就可以完成很多超越个体智慧的决策。当然我不觉得AI的单个神经元是愚笨的，而是会不会这种“意识”，也会因为大量功能迭代，学习，突然涌现出来，就像人类的进化，不知怎么的就有了意识。就像这个世界的一切都是由原子构成，但如果只是计算原子之间的相互作用力，我们永远也无法理解化学，也无法理解生命。所以，如果仅仅从还原论的角度把AI看作只做二元分裂的圆圈和线，我们就永远无法理解大语言模型今天涌现出的抽象逻辑和推理能力，为此，我们需要在一个新的层级重新理解这件事。

三、中文房间

1980年，美国哲学教授John Searle在这篇名为《心智大脑和程序》[10]的论文中提出了一个著名的思想实验，中文房间。把一个只懂英文的人关在一个封闭的房间里，只能通过传递纸条的方式和外界对话。房间里有一本英文写的中文对话手册，每一句中文都能找到对应的回复。这样房间内的人就可以通过手册顺畅的和外界进行中文对话，看起来就像是会中文一样，但实际上他既不理解外面提出的问题，也不理解他所返回的答案。

他试图通过中文房间证明，不管一个程序有多聪明或者多像人，他都不可能让计算机拥有思想、理解和意识。真的是这样吗？在这个名为互联网哲学百科全书的网站中，可以看到围绕中文房间的各种争论，他们都没能互相说服。

这些讨论都停留在思想层面，因为如果只靠一本打印出来的手册，中文房间是不可能实现的。中文对话有着无穷无尽的可能，即便是同样一句话，上下文不同，回答也不同。这意味着手册需要记录无限多的情况，要不然总有无法回答的时候。但诡异的是，ChatGPT真的实现了。作为一个只有330GB的程序，ChatGPT在有限的容量下实现了几乎无限的中文对话，这意味着他完成了对中文的无损压缩。

想象有一个这样的复读机，空间只有100MB，只能放十首歌。要听新的歌，就得删掉旧的歌。但现在我们发现了一个神奇复读机。现在只需要唱第一句，这个复读机就可以通过续写波形的方式把任何歌曲播放出来。我们应该怎么理解这个复读机？我们只能认为他学会了唱歌。

四、Compression - 压缩即智慧

回想GPT的学习过程，它所做的，就是通过它的1750亿个参数，实现了它所学习的这4990亿个token的压缩。到这一步，逐渐意识到，是压缩产生了智能。

Jack Ray, OpenAI大语言模型团队的核心成员，在视频讲座中提到，压缩一直是我们的目标。

接下来是我对于压缩及智能这件事的理解，假设我要给你发送这句话，“压缩即智慧”。

我们可以把GPT当做一种压缩工具，我用它压缩这句话，你收到后再用GPT解压，我们得先知道这句话的信息量有多大。在GBK这样的编码里，一个汉字需要两个字节，也就是16个0/1来表述，这可以表示2的16次方，也就是65536种可能。这句话一共5个字符，就需要一共80个0和1，也就是80比特。但实际上这句话的信息量是可以小于80比特的。它的真实信息量其实可以用一个公式计算。

这是1948年香农给出的信息熵的定义，它告诉我们信息的本质是一种概率密度。我们可以把这里的P简单理解为每个字出现的概率，它们出现的概率越低，整句话的信息量就越大。如果这句话里的每个字都是毫无规律的随机出现，那么P的概率就是1/65536，计算后的信息量就是原始的80比特。常见的传统压缩方法是找到重复的字，但几乎不重复的句子就很难压缩。更重要的是，正常的语言是有规律的，“压”后面跟着“缩”的概率远大于1/65536，这就给了信息进一步压缩的空间。而语言模型所做的就是在压缩的过程中找到语言的规律，提高每个字出现的概率。比如我们只发送“压缩”，让语言模型开始续写，预测的概率表里就会出现接下来的词，我们只需要选择“即”和“智慧”所在的位置，例如（402，350）。那这两这个数字就实现了信息的压缩，接收方基于这些信息，从相同语言模型的概率去处理，选出数字对应的选项，就完成了解压。2个最大不超过5000的数字，每个数字只要13位0/1就能表示，加上前2个字，一共也只需要发送52位0/1，信息压缩到原来的52/80大约65%。

相反，如果语言模型的预测效果很差，后续文字的词表还是会很长，无法实现很好的压缩效果。所以可以发现，压缩效果越好意味着预测效果越好，也就反映了模型对于被压缩信息的理解，而这种理解本身就是一种智能。为了把九九乘法表压缩的足够小，他需要理解数学，而如果把行星坐标压缩的足够小，他可能就理解了万有引力。今天，大语言模型已经成为了无损压缩的最佳方案，可以实现14倍的压缩率。压缩这一视角最大的意义在于，相比于神秘莫测的涌现，它给了我们一个清晰明确、可以量化机器智能的方案。即便面对中文房间这样的思想实验，我们也有办法研究这个房间的智能程度。

但是，通过压缩产生的智慧和人的心智真的是同一种东西吗？

五、写在最后

如果要问，现阶段GPT和人类说话方式最大的不同是什么，我认为，答案是他不会说谎。对于语言模型来说，说和想是一件事情，他只是一个字一个字的把他的思考过程和心理活动说出来了而已。GPT从不回答我不知道，因为他并不知道自己不知道，这就是AI的幻觉，看起来就像是一本正经的胡说八道，他只是想让对话继续下去，是否正确反而没那么重要。优化这个问题的方法也很简单，只需要在提问的时候多补充一句，Let’s think step by step，请逐步分析，让GPT像人一样多想几步，对他来说也就是把想的过程说出来。Step by step，这种能力也被称为Chain of Thought，思维链。心理学家Daniel Kahneman把人的思维划分成了两种，系统一是直觉、快速的、没有感觉的，系统二则需要主动的运用知识、逻辑和脑力来思考。前者是快思考，就像我们可以脱口而出八九七十二，九九八十一，而后者是慢思考。就比如要回答72乘81是多少，就必须列出过程，一步步计算。思维链的存在意味着大语言模型终于有了推理能力。而为了做到这件事，我们的大脑进化了6亿年。我们可以在6亿年前的水母身上看到神经网络最古老的运行方式。水母外围的触角区域和中心的嘴部区域都有神经元。当触角感知到食物时，这里的神经元会激活，然后把信号传给中心的神经元，食物也会被这个触角卷起来送到嘴里。漫长的岁月里，我们的大脑就在神经网络的基础上一层又一层的叠加生长出来。

首先进化出来的是爬虫类脑，这部分和青蛙的脑子有点像，它控制着我们的心跳、血压、体温这些让我们不会死的东西。然后是古生物脑，它支配着我们的动物本能，饥饿、恐惧和愤怒的情绪，繁衍后代的欲望都来自边缘系统的控制。而最外侧这两毫米左右的薄薄的一层，是最近几百万年才进化出来的新结构、新皮质，我们人类引以为傲的那些部分，语言、文字、视觉、听力、运动和思考都发生在这里，但我们对新皮质还是知之甚少。目前已知的是，这里有大概200亿个神经元，每一平方厘米的新皮质中都大约有一千万个神经元和500亿个神经元之间的连接。只需要从人类大脑外侧取下一小片三平方厘米的新皮质，就已经和ChatGPT大的吓人的参数量类似了。而我们的大脑之所以需要这么多神经元，是因为GPT仅仅需要预测下一个词，而我们的神经元需要时刻预测这个世界下一秒会发生什么。

最近几十年的神经科学研究发现除了能激活神经元的突触信号，还存在大量负责预测的树突脉冲信号。一个处于预测状态的神经元如果得到足够强的突出信号，就可以比没有预测状态的神经元更早的被激活，进而抑制其他的神经元。这意味着有一个事无巨细的世界模型就存储在我们新皮质的200亿个神经元里，而我们的大脑永远不会停止预测。所以，当我们看到一个东西，其实看到的是大脑提前构建的模型，如果它符合我们的预测，无事发生。而一旦预测错误，大量的其他神经元就会被激活，让我们注意到这个错误，并及时更新模型。所以每一次错误都有它的价值。我们也正是在无数次的预测错误和更新认知中真正认识了世界。

现在我可以试着回答最初的问题，GPT或许尚未涌现心智，但他已经拥有了智能。它是一个“大”的语言模型，是几百万个圆圈和线互相连接的分类器，是通过预测下一个词实现文字接龙的聊天大师，是不断向上抽取意义的天才金鱼，是对几千亿文字无损压缩的复读机，是不论对错永远积极回应人的助手。它可能又是一场快速退潮的科技热点，也可能是人类的最后一项重要的发明。从围棋、绘画、音乐到数学、语言、代码，当AI开始在那些象征人类智力和创造力的事情上逐渐超越的时候，给人类最大的冲击不仅仅是工作被替代的恐惧，而是一种更深层的自我怀疑。人类的心智是不是要比我们想象的浅薄的多，我不这么认为。

机器可以是一个精妙准确的复读机，而人类是一个会出错的复读机。缺陷和错误定义了我们是谁。每一次不合规矩，每一次难以理解，每一次沉默、停顿和凝视，都比不假思索的回答更有价值。

参考文献

[1] Vaswani, Ashish, et al. “Attention is all you need.” Advances in neural information processing systems 30 (2017).

[2] Radford, Alec, et al. “Language models are unsupervised multitask learners.” OpenAI blog 1.8 (2019): 9.

[3] Brown, Tom, et al. “Language models are few-shot learners.” Advances in neural information processing systems 33 (2020): 1877-1901.

[4] Rosenblatt, F. "The perceptron: A probabilistic model for information storage and organization in the brain." Psychological Review, 65 (1958): 386–408.

[5] Radford, Alec, et al. “Improving language understanding by generative pre-training.” (2018).

[6] Bills, Steven, et al. “Language models can explain neurons in language models.” URL https://openaipublic. blob. core. windows. net/neuron-explainer/paper/index. html.(Date accessed: 14.05. 2023) (2023).

[7] Anderson, Philip W. “More Is Different: Broken symmetry and the nature of the hierarchical structure of science.” Science 177.4047 (1972): 393-396.

[8] Gurnee, Wes, et al. “Finding Neurons in a Haystack: Case Studies with Sparse Probing.” arXiv preprint arXiv:2305.01610 (2023).

[9] Wei, Jason, et al. “Emergent abilities of large language models.” arXiv preprint arXiv:2206.07682 (2022).

[10] Searle, John R. “Minds, brains, and programs.” Behavioral and brain sciences 3.3 (1980): 417-424.

作者：京东零售李新健
来源：京东云开发者社区转载请注明来源

你可能感兴趣的:(人工智能,chatgpt,京东云,机器学习,人工智能)

通义千问 Qwen2-VL-2B：技术架构、核心原理、微调操作与场景应用详解 zhangjiaofa 大模型通义千问大模型多模态模型微调
通义千问Qwen2-VL-2B：技术架构、核心原理、微调操作与场景应用详解引言近年来，多模态大模型在人工智能领域取得了显著进展，尤其是在视觉语言理解（Vision-LanguageUnderstanding,VL）方面。阿里云通义千问团队推出的Qwen2-VL-2B模型，作为Qwen2-VL系列中的轻量级版本，凭借其高效的计算性能和强大的多模态处理能力，成为开源社区和工业界关注的焦点。本文将深入解
可解释性：走向透明与可信的人工智能一位小说男主人工智能入门深度学习机器学习人工智能神经网络
随着深度学习和机器学习技术的迅速发展，越来越多的行业和领域开始应用这些技术。然而，这些技术的“黑盒”特性也带来了不容忽视的挑战。在许多任务中，尽管这些模型表现出色，取得了相当高的精度，但其决策过程不透明，这对于依赖于机器决策的应用（如金融、医疗、法律等）来说，可能是无法接受的。因此，如何提高模型的可解释性、实现透明和可信的人工智能，成为了当下人工智能领域的重要课题。❤️本文将深入探讨机器学习中的可
**LLM Gateway：您的智能对话门户** 芮奕滢Kirby
LLMGateway：您的智能对话门户llm-gatewayGatewayforsecure&reliablecommunicationswithOpenAIandotherLLMproviders项目地址:https://gitcode.com/gh_mirrors/ll/llm-gateway在人工智能和自然语言处理的浪潮中，LLMGateway以其卓越的设计与功能脱颖而出，为开发者和用户提供
爬虫实战--- （6）链家房源数据爬取与分析可视化 rain雨雨编程爬虫实战系列 python 爬虫数据分析
文章持续跟新，可以微信搜一搜公众号[rain雨雨编程]，第一时间阅读，涉及数据分析，机器学习，Java编程，爬虫，实战项目等。目录前言1.爬取目标2.所涉及知识点3.步骤分析（穿插代码讲解）步骤一：发送请求步骤二：获取数据步骤三：解析数据步骤四：保存数据4.爬取结果5.完整代码6数据可视化前言今天我将为大家分享一个非常实用的Python项目——链家房源数据的爬取与分析可视化。在这篇文章中，我们将分
使用scikit-learn实现线性回归对自定义数据集进行拟合 Luzem0319 scikit-learn 线性回归 python
1.引入必要的库首先，需要引入必要的库。scikit-learn提供了强大的机器学习工具，pandas和numpy则用于数据处理，matplotlib用于结果的可视化。importpandasaspdimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.linear_modelimportLinear
AI如何帮助解决生活中的琐碎难题？ HUIBUR科技人工智能
引言：AI已经融入我们的日常生活你有没有遇到过这样的情况——早上匆忙出门却忘了带钥匙，到了公司才想起昨天的会议资料没有打印，或者下班回家还在纠结晚饭吃什么？这些看似微不足道的小事，往往让人疲惫不堪。而如今，人工智能（AI）的出现，正在悄然改变这一切。从语音助手到智能家居，从健康管理到购物推荐，AI正在帮助人们处理生活中的琐碎事务，让每一天变得更高效、更轻松。只需要动动嘴或者点一点手机，就能完成过去
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型大霸王龙人工智能
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型，其在知识类任务上展现出了卓越的性能。以下是对DeepSeek的详细介绍，内容虽无法达到10000字，但会尽可能全面且深入地解析其各个方面。一、公司背景与核心理念DeepSeek的母公司深度求索由幻方量化在2023年4月创立。幻方量化是国内量化私募领域的巨头之一，管理规模庞大。DeepSeek的
数据挖掘的常用算法北柠陌寒0207 笔记
在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。目前,在很多领域尤其
OpenAI的编程语言和框架，给程序员带来了帮助有哪些 API技术大佬Anzexi58 OpenAI 人工智能人工智能深度学习
OpenAI是一个人工智能开发公司，成立于2015年，总部位于美国旧金山。这家公司致力于研究和开发先进的人工智能技术，旨在将这些技术应用到解决全球一些最棘手的问题上。OpenAI以其卓越的技术和实验室出品的groundbreakingAIpapers而闻名。OpenAI的研究涉及深度学习、自然语言处理、视觉感知、强化学习等多个领域，并已在各种应用中取得了令人瞩目的成果。例如，在机器人领域，Open
LangGraph系列-1：用LangGraph构建简单聊天机器人梦想画家机器学习 LangGraph LangChain
在快速发展的人工智能和大型语言模型（llm）世界中，开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。虽然LangChain已经改变了这个领域的游戏规则，允许创建复杂的链和代理，但对代理运行时的更复杂控制的需求也在不断增长。LangGraph是建立在LangChain之上的重要模块，它将彻底改变我们设计和实施人工智能工作流的方式。在这篇博客中，我们提供了一个关于构建聊天机器人和彻底改
探索OpenAI Python SDK: 智能编程新里程周澄诗Flourishing
探索OpenAIPythonSDK:智能编程新里程openai-pythonTheofficialPythonlibraryfortheOpenAIAPI项目地址:https://gitcode.com/gh_mirrors/op/openai-python如果你对人工智能和自然语言处理有浓厚的兴趣，那么这个项目将为你开启新的探索之门——。这是一个由OpenAI开发的Python库，用于与他们的A
ChatGPT：OpenAI SDK 是什么？ XRT_knives #知识图谱 chatgpt openai
ChatGPT：OpenAISDK是什么？OpenAISDK是OpenAI提供的软件开发工具包（SoftwareDevelopmentKit），用于简化与OpenAIAPI的交互。SDK提供了高层次的接口，使得开发者可以更容易地在应用程序中集成OpenAI的语言模型和其他功能。具体来说，OpenAISDK主要有以下几个作用：简化API调用：SDK封装了底层的API调用细节，提供了更简洁、易用的接口
Upgini: 智能数据搜索与丰富化引擎 - 提升机器学习和人工智能模型准确性的利器 2401_87189860 人工智能机器学习
Upgini:智能数据搜索与丰富化引擎在当今数据驱动的世界中,机器学习和人工智能模型的准确性至关重要。然而,提高模型准确性往往是一项艰巨的任务,需要大量的特征工程和数据处理工作。幸运的是,Upgini这一创新的Python库为数据科学家和机器学习工程师提供了一个强大的解决方案。Upgini的核心功能Upgini是一个智能数据搜索和丰富化引擎,专为机器学习和AI设计。它的主要功能包括:自动特征发现与
CopilotForXcode: 为Xcode带来AI辅助编程的强大扩展 2401_87189860 xcode 人工智能 macos
CopilotForXcode:为Xcode带来AI辅助编程的强大扩展在人工智能快速发展的今天，AI辅助编程工具正在成为开发者提升效率的重要助手。对于使用Xcode进行iOS、macOS等Apple平台开发的Swift程序员来说，一款名为CopilotForXcode的扩展正在受到越来越多的关注。本文将详细介绍CopilotForXcode的主要功能、安装配置过程以及使用技巧，帮助开发者充分利用这
《机器学习实战》——在python中使用Matplotlib注解绘制树形图哆啦AA梦 python 机器学习 python 机器学习
#encoding=utf-8#使用文本注解绘制树形图importmatplotlib.pyplotaspltdecisionNode=dict(boxstyle="sawtooth",fc="0.8")leafNode=dict(boxstyle="round4",fc="0.8")arrow_args=dict(arrowstyle="<-")#上面三行代码定义文本框和箭头格式#定义决策树决策
DeepSeek：突破传统的AI算法与下载排行分析 smart_ljh 行业搜索人工智能 AI
DeepSeek的AI算法突破DeepSeek相较于OpenAI以及其它平台的性能对比DeepSeek的下载排行分析（截止2025/1/28AI人工智能相关DeepSeek甚至一度被推上了搜索）未来发展趋势总结在人工智能技术飞速发展的当下，搜索引擎市场也迎来了新的变革。DeepSeek，作为一款基于深度学习技术和大数据算法的搜索引擎，以其独特的优势在国内外市场上引起了广泛关注。下面介绍一下针对De
【外文原版书阅读】《机器学习前置知识》1.线性代数的重要性，初识向量以及向量加法 Icomi_ 807.《机器学习前置知识》机器学习人工智能计算机视觉深度学习神经网络 c++c语言
目录编辑编辑1.Chapter2WhyLinearAlgebra?2.Chapter3WhatIsaVector?个人主页：Icomi大家好，我是Icomi，本专栏是我阅读外文原版书《BeforeMachineLearning》对于文章中我认为能够增进线性代数与机器学习之间的理解的内容的一个输出，希望能够帮助到各位更加深刻的理解线性代数与机器学习。若各位对本系列内容感兴趣，可以给我点个关注跟进内容
Python 实现车牌识别菜狗小测试 Python技术专栏 python 计算机视觉 opencv
一、车牌识别的基本原理车牌识别主要包括以下几个步骤：图像采集：通过摄像头或其他图像采集设备获取包含车牌的图像。图像预处理：对采集到的图像进行灰度化、滤波、增强等操作，以提高图像的质量和清晰度，便于后续的处理。车牌定位：从预处理后的图像中找出车牌的位置。这可以通过一些特征提取和机器学习算法来实现，例如基于颜色特征、边缘特征等方法来定位车牌区域。字符分割：将定位到的车牌区域中的字符分割开，以便对每个字
数学与机器学习：共舞于智能时代的双璧每天五分钟玩转人工智能机器学习人工智能
随着人工智能的崛起，机器学习作为其核心技术之一，正引领着新一轮的科技革命。而在这场革命中，数学以其深邃的理论和精妙的工具，为机器学习提供了坚实的支撑。数学与机器学习之间的关系，如同琴瑟和鸣，共同编织出智能时代的华美乐章。数学，作为自然科学的皇后，以其严谨的逻辑和精确的推理，为机器学习提供了坚实的理论基础。机器学习算法的设计、优化和应用，都离不开数学的支持。无论是线性代数、概率统计，还是微积分、最优
动物产生式识别系统（人工智能实验）不爱编程的程序媛人工智能数据结构算法
1.实验原理首先，定义两个整数数组`base`和`temp`，分别用于存储特征值和临时存储输入的特征值。输出特征值代表的信息，包括每个特征值对应的动物类型。提示输入特征值的总数，并使用`Scanner`类从控制台读取输入。使用循环遍历输入的特征值，将其存储在`temp`数组中，并在`base`数组中将对应特征值的位置设为1。根据输入的特征值，设置`base`数组中其他位置的值。例如，如果输入的特征
大模型应用：探索AI大模型的50个应用场景：让科技改变生活。 AGI大模型资料分享员人工智能科技生活 agi 语言模型自然语言处理
随着人工智能技术的迅猛发展，AI大模型在各个领域的应用日益广泛。百度创始人、董事长兼首席执行官李彦宏在2024年世界人工智能大会上表示，目前AI技术发展路线发生了方向性改变，已从过去辨别式人工智能转向了未来生成式人工智能。他更是呼吁：“大家不要卷模型，要卷应用！”本文将为大家盘点AI大模型的50个应用场景，并按应用频率从高到低进行排列，带您了解AI如何深刻改变我们的工作与生活。1.自然语言处理(N
ChatGPT到底是什么？会给我们生活来这些改变↓ 大模型. chatgpt 生活 microsoft 语言模型人工智能架构大模型
2022年底，“ChatGPT”这个词悄然进入公众视野。如果你没听说过，或是只把它当成一个聊天机器人，那就太小看它了。很多行业，比如新闻、律师、教育、客服咨询等等，已经把ChatGPT应用在了生产、服务中。那么，ChatGPT究竟是什么？本期内容，我们就来了解ChatGPT和它背后的技术。我们先从它的名字说起。Chat，直译为“闲聊”，可以说ChatGPT是用起来如同微信或QQ的一个聊天应用。只不
盘点50个AI大模型企业和典型产品大模型玩家人工智能语言模型 ai 自然语言处理深度学习大模型
OpenAI：-ChatGPT：是OpenAI推出的非常具有影响力的聊天机器人程序，能够进行自然流畅的对话、文本创作、问题解答等，不断迭代升级，引发了全球对大模型的广泛关注。-GPT-4O：OpenAI的新一代AI模型，在语言理解和生成能力上有进一步提升，能够感知用户的情绪，并针对问题以带有情绪的“嗓音”做出反馈。-Sora：文生视频大模型，可根据文本指令生成复杂且具有一定时长的视频，具有多个镜头
从模型到实际：人工智能项目落地的关键要素 IT猫仔科技人工智能语言模型自然语言处理搜索引擎服务器机器学习
引言近年来，人工智能技术从实验室走向实际应用，其潜力在各行各业得到了初步的验证。然而，AI技术的落地并非一蹴而就，许多企业在尝试部署AI项目时，却发现自己陷入了“模型很好看，应用却难做”的困境。无论是数据准备不足、算法与场景的不匹配，还是缺乏持续优化的机制，这些问题都可能导致项目停滞，甚至功亏一篑。前排提示，文末有大模型AGI-CSDN独家资料包哦！对于企业来说，人工智能的价值不仅在于模型的高精度
大模型产品架构全景解读：从应用场景到技术支持的完整路径健忘的派大星架构人工智能语言模型 ai agi LLM AI大模型
前言随着人工智能技术的迅猛发展，大模型逐渐成为推动各行业智能化转型的核心动力之一。大模型不仅可以处理大量数据，进行复杂任务的自动化，还能通过微调、蒸馏等技术在特定场景中表现出色。本文将结合大模型产品架构图，详细解读每一个组成模块，帮助读者理解从应用场景到技术支持的完整路径，洞察大模型如何在实际业务中落地。一、落地场景：赋能业务的智能化解决方案大模型的实际价值首先体现在各个业务场景的落地应用中。在架
scikit-learn基本功能和示例代码 weixin_30777913 深度学习机器学习 python scikit-learn
scikit-learn（简称sklearn）是一个广泛使用的Python机器学习库，提供了丰富的工具和算法，涵盖了数据预处理、模型训练、评估和优化等多个方面。scikit-learn是一个功能强大的机器学习库，涵盖了数据预处理、分类、回归、聚类、降维、模型选择与评估等多个方面。通过上述代码示例，您可以快速上手并使用scikit-learn进行机器学习任务。以下是对scikit-learn主要功能
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计） m0_71334485 数据 #上市公司上市公司数字化转型数字化转型上市公司
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计）1、时间：2000-2021年2、来源：上市公司NB3、范围：上市公司4、指标：包括人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用和数字技术应用、互联网商业模式、智能制造、现代信息系统等9个维度175个词频类别、股票代码、股票简称、年报标题、年份、MD&A文本-文本总长度、MD&A文本仅中英文-文本总长度、人工
There was a problem confirming the ssl certificate: [SSL:CERTIFICATE_ VERIFY_ FAILED]certificate解决方案爱编程的喵喵 Python基础课程 python pip SSL certificate 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Therewasaproblemco
chatgpt赋能python：Python怎么安装到U盘 vacvefito ChatGpt chatgpt 人工智能计算机
Python怎么安装到U盘在日常的编程工作中，Python是一门十分常用的编程语言。而有时候并非每个人都愿意在电脑上安装Python，或者在外出时需要借助一台非自己的电脑来进行Python编程。因此，将Python安装到U盘成为一个方便实用的选择。为什么要将Python安装到U盘将Python安装到U盘可以让我们在不同设备上进行Python编程，而不用担心设备内是否已经安装了Python。这样可以
chatgpt赋能python：在U盘上安装Python开发环境教程 tulingtest ChatGpt chatgpt python 开发语言计算机
在U盘上安装Python开发环境教程如果你是一位Python开发人员，那么你肯定知道，为了成功地开发和运行Python程序，需要安装Python开发环境。然而，对于很多人来说，它们的工作地点可能不支持安装软件，或者他们需要在多个设备上使用Python开发环境。针对这些情况，将Python开发环境安装到U盘上就成了必要的。优点使用U盘上Python开发环境的好处如下：灵活性：可以在任何地方使用Pyt
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l