WitsMakeMen

ChatGPT是如何产生心智的？

一、前言 - ChatGPT真的产生心智了吗？

来自斯坦福大学的最新研究结论，一经发出就造成了学术圈的轰动，“原本认为是人类独有的心智理论（Theory of Mind，ToM），已经出现在ChatGPT背后的AI模型上”。所谓心智理论，就是理解他人或自己心理状态的能力，包括同理心、情绪、意图等。这项研究中，作者发现：davinci-002版本的GPT3已经可以解决70%的心智理论任务，相当于7岁儿童。

2023 年，面对铺天盖地的 AI 应用，我们人类终于意识到，有一些东西被永远的改变了。但在这波 AI 热潮之中，只有一个应用是真正吓人的——ChatGPT。由于心智无法通过量化评判，但ChatGPT确实满足智能的定义，例如推理、计划、解决问题、抽象思考、理解复杂想法、快速学习。但ChatGPT本质上只做一件事情：续写。当我们给出前N个词汇的时候，如果一个模型能够告诉我们第“N+1”个词汇大概率会是什么，我们就认为模型掌握了语言的基本规律。

为什么光凭“续写”就可以产生智能？以下是摘自知乎的一段回答：

“为什么这么一个简单的接话茬能力让ChatGPT看起来能够解决各种各样的任务呢？因为我们人类大部分的任务都是以语言为载体的。当我们前面说了一些话，它把接下来的话接上，任务就完成了。ChatGPT作为一个大语言模型，目的就是“把话接上”，而把话接上这件事情可以在不知不觉中帮我们完成各种任务。”，这也解释了为什么ChatGPT有时候瞎胡诌，他并没有撒谎，他不知道对错，他只是想把对话顺利进行下去。

如果真的像上述所说，那GPT似乎没有我们想象的神奇，看起来只是一个基于大数据和统计学的语言模型，通过它学习的海量文本预测下一个概率最高的词。就像是有一个容量巨大的“数据库”，所有的回答都是从这个数据库里拿到的。

但奇怪的是，ChatGPT又可以回答他没有学习过的问题，最具代表性的是训练集中不可能存在的六位数加法，这显然无法通过统计学的方式来预测下一个最高概率的数字是多少。

不仅如此，GPT还学习到了在对话中临时学习的能力。

看起来ChatGPT除了“续写”外，还真的产生了逻辑推理能力。这些统计之外的新能力是如何出现的？

如何让机器理解语言，如何让代码存储知识？这篇文章，只是为了回答一个问题：一段代码是如何拥有心智的？

二、Attention is all you need - 注意力机制

搜索所有有关ChatGPT的文章，发现有一个词的出现频率特别高，Attention is all you need。ChatGPT的一切都建立在“注意力机制”之上，GPT的全称是Generative Pre-trained Transformer，而这个transformer就是一个由注意力机制构建的深度学习模型。其来源于2017年的一篇15页的论文，《Attention is all you need》[1]。再结合OpenAI对于GPT2和GPT3的两篇论文[2][3]，我们可以拆开这个大语言模型，看看他在说话的时候究竟发生了什么。

注意力机制的诞生来源于人脑的思维方式，例如在读这段话时，你的注意力会不断的从左往右一个字一个字的闪过，之后再把注意力放到完整的句子上，理解这些字词的关系，其中有些关键词还会投入更多的注意，这一切发生在电光火石之间。

而基于注意力机制的Transformer和GPT系列模型就是在模拟这一思维过程，通过让机器理解一句话中字词之间的关系和意义，完成下一个词的续写，然后再理解一遍，再续写一个词，最后写成一段话。要让程序模仿这件事并不容易。如何让机器计算字符，如何让代码存储知识，为什么将以上模型框架中的一个单元拆开后，全都是圆圈和线？

所以研究AI的第一步，是搞清楚上图中的一个圆圈究竟能够干什么。

2.1 神经元 - 圆圈和线

1957年的一篇论文，《感知器：大脑中信息存储和组织的概率模型》[4]中也出现了一堆圆圈和线，这就是今天各种AI模型的基本单元，我们也叫它神经网络。一个世纪前，科学家就已经知道了人脑大概的运作方式，这些圆圈模拟的是神经元，而线就是把神经元连接起来的突触，传递神经元之间的信号。

将三个神经元连接在一起，就得到了一个开关，要么被激活输出1，要么不被激活输出0。开关可以表达是否，区分黑白，标记同类，但是归根到底都是一件事情，分类。过去几十年，无数个人类最聪明的头脑所做的，就是通过各种方式把这些圆圈连接起来，试图产生智能。

这个网站可以模拟更多的神经元分裂问题。可以看到一个神经元能处理的情况还是太有限了，能分开明显是两块的数据，而内圈外圈的数据就分不开。但如果加入激活函数，再增加新的神经元，每一个新增的神经元都可以在边界上新增一两条折线，更多的折线就可以围得越来越像一个圆，最终完成这个分类。

分类可以解决很多具体问题，假如上图中的每个点的X轴和Y轴分别代表一只小狗的岁数和体重，那么只凭这两种数值就可以分出来这是两个不同品种的狗，每个点代表的信息越多，能解决的问题也就越复杂。比如一张784个像素的照片，就可以用784个数字来表示分类，这些点就能分类图片。更多的线，更多的圆圈，本质上都是为了更好的分类。这就是今天最主流的AI训练方案，基于神经网络的深度学习。

学会了分类，某种程度上也就实现了创造。

这就是为什么有这么多业界学者意识到了深度学习的本质，其实是统计学，沿着圆圈和线的道路，他们终究会到达终点，成为人人都可以使用的工具。而如果拆开GPT系列模型，暴露出来的也仍然只是这些圆圈和线。但分类和统计真的能模仿人的思维吗？在论述之前，先了解一下成语接龙的底层原理。

2.2 成语接龙

在2018年第一代GPT的原始论文[5]中，我们可以看到GPT系列的模型结构。回想上文中提到的注意力机制，这一层被叫做注意力编码层，它的目标就是模仿人的注意力，抽取出话语之间的意义，把12个这样的编码层叠在一起，文字从下面进去，出来的就是GPT预测的下一个词。

比如输入how are you之后，模型会输出下一个单词doing，为什么它会输出doing？接下来我们就得搞明白中间到底发生了什么。

输入how are you后，这三个单词会被转换为3个1024维度的向量，接着每个向量都会加上一个位置信息，表示how是第一个词，are是第二个词，以此类推之后它们会进入第一个注意力编码层，计算后变成三个不一样的1024长的向量，再来到第二层、第三层，一直经过全部的24个注意力编码层的计算处理，仍然得到三个1024长的向量，对下一个词的续写结果就藏在最后一个向量里面。关键的计算就发生在这些注意力编码层，这一层里又可以分成两个结构，先算多头注意力，再算全连接层。注意力层的任务是提取话语间的意义，而全链接层需要对这些意义做出响应，输出存储好的知识。

我们可以先用how做个例子，注意力层里有三个训练好的核心参数KQV，用于计算词语间的关联度，将它们与每个向量相乘后，就能得到how和are的关联度，再通过这种方式计算how和you， how和how的关联度，就能得到三个打分，分数越高意味着它们的关联越重要。之后再让三个分数和三个有效信息相乘再相加，就把how变成了一个新的64个格子的向量，然后对are和you做同样的操作，就得到了三个新的向量。

参与这轮计算的KQV是固定的，而模型里一共有16组不同的KQV，他们分别都会做一轮刚才这样的运算，得到16组不同的输出，这叫做多头注意力，意味着对这句话的16组不同的理解。把它们拼在一起，就得到了和输入相同长度的1024个格子，再乘一个权重矩阵W就进入到了全链接层的计算。

在全连接层里，就是4096个我们熟悉的神经元，它们都还是在做分类的工作。这里的计算是把被注意力层转换后的how向量和这里的每一个神经元都连接在一起，1024个格子里的每一个数字都分别和第一个神经元的连线的权重相乘再相加，这个神经元会输出一个相似度分值，与此同时，每一个神经元都在做类似的操作。只有少数神经元的输出大于零，也就意味着神经元对这个敏感，再连接1024个格子号所对应的向量，就又得到了一个新的向量。之后are和you做类似的计算，就得到了三个和初始长度一样的1024长的格子串，这就是一层注意力编码层内发生的事情。之后的每一层都按照相同的流程在上一层的基础上做进一步的计算，即便每一层都只带来了一点点理解，24层算完以后也是很多理解了，最终还是得到三个向量，每个1024长。而模型要输出的下一个词就基于这最后一个向量，也就是you变换来的向量，把它从1024恢复成0-50256范围的序号，我们就能看到这个序号向量在词表里最接近的值。到这一步就可以说模型算出了how are you之后的下一个词，最有可能是doing。

我们希望模型继续续写，就把这个doing续在how are you后面，转换成四个向量，再输入进模型，重复刚才的流程，再得到下一个词。这样一个接一个，一段话越来越长，直到结束，变成我们看到的一段话，这就是文字接龙的秘密。而ChatGPT也只是把这个续写模型改成了对话界面而已，你提的每一个问题都会像这样成为续写的起点，你们共同完成了一场文字接龙。

2.3 “大”语言模型

刚刚提到的每一层的计算流程长，其实还好，GPT真正吓人的地方是参数量大。GPT1的基本尺寸是768，每一层有超过700万个参数，12层就是1.15亿个参数，在他发布的2018年已经非常大了。我们刚刚拆开的GPT medium基本尺寸是10241，共有24层，每一层有1200万参数，乘起来就是3.5亿参数。而到了ChatGPT用的GPT3的版本，它的参数量是1750亿，层数增加到了96层。GPT4并没有公布它的大小，有媒体猜测它是GPT3的六倍，也就是一万亿参数。这意味着，即便把一张3090显卡的显存变大几百倍，让他能装的下级GPT4，回答一个简单问题可能仍然需要计算40分钟。

拆开这一切，就会发现没有什么惊人的秘密，只有大，文明奇观的那种大，无话可说的那种大，这就是GPT系列的真相，一个“大”语言模型。但是我们还是无法回答为什么这样的模型能够产生智能，以及现在还出现了一个新的问题，为什么参数量非得这么大？

让我们先总结一下目前的已知信息，第一，神经网络只会做一件事情，数据分类，第二，GPT模型里注意力层负责提取话语中的意义，再通过全链接层的神经元输出存储好的知识，第三，GPT说的每一个词都是把对话中的所有词在模型中跑一遍，选择输出概率最高的词。所以，GPT拥有的知识是从哪来的？我们可以在OpenAI的论文中看到ChatGPT的预训练数据集，他们是来自网站、图书、开源代码和维基百科的大约700GB的纯文本，一共是4991个token，相当于86万本西游记。而它的训练过程就是通过自动调整模型里的每一个参数，完成了这些海量文字的续写。

在这个过程中，知识就被存储在了这一个一个的神经元参数里，之后它的上千亿个参数和存储的知识就不再更新了。所以我们使用到的ChatGPT其实是完全静止的，就像一具精致的尸体，它之所以看起来能记住我们刚刚说的话，是因为每输出一个新的词，都要把前面的所有词拿出来再算一遍，所以即便是写在最开头的东西，也能够影响几百个单词之后的续写结果。但这也导致了ChatGPT每轮对话的总词汇量是有上限的，所以GPT不得不限制对话程度。就像是一条只有七秒记忆的天才金鱼。

现在回到前言中提到的问题，为什么ChatGPT可以回答他没有学习过的互联网不存在的问题，例如一个训练数据里不可能存在的六位数加法，这显然无法通过统计学的方式来预测下一个最高概率的数字是多少，这些统计之外的新能力是如何出现的？

今年5月，OpenAI的新研究给了我启发，这篇论文名为《语言模型，可以解释语言模型中的神经元》[6]。简单来说就是用GPT4来解释GPT2。给GPT2输入文本时，模型里的一部分神经元会激活，Open AI让GPT4观察这个过程，猜测这个神经元的功能，再观察更多的文本和神经元，猜测更多的神经元，这样就可以解释GPT2里面每一个神经元的功能，但是还不知道GPT4猜的准不准。验证方法是让GPT4根据这些猜想建立一个仿真模型，模仿GPT2看到文本之后的反应，再和真的GPT2的结果做对比，结果一致率越高，对这个神经元功能的猜测就越准确。OpenAI在这个网站里记录了他们对于每一个神经员的分析结果。

比如我们输入30, 28，就可以看到第30层的第28个神经元的情况。GPT4认为这个神经元关注的是具体时间。下面是各种测试例句，绿色就表示神经元对这个词有反应，绿色越深，反应就越大。可以发现，即便拼写完全不同，但这些模型中间层的神经元也已经可以根据词语和上下文来理解它们的意义了。

但OpenAI也发现，只有那些层数较低的神经元才是容易理解的。这个柱状图里的横坐标是对神经元解释的准确程度，纵坐标是神经元的数量。可以看到，对于前几层的神经元，差不多一半都能做到0.4以上的准确度。但是层数越高，得分低的神经元就越来越多了，大多数神经元还是处在一片迷雾之中。

因为对于语言的理解本来就是难以解释的，比如这样一段对话。对于中文母语的我们来说，很快就能理解这段话的意思，但是对于一个神经网络，只靠几个对“意思”有反应的神经元显然是不够意思。

A：“你这是什么意思？”
B：“没什么意思，意思意思。”
A：“你这人真有意思。”
B：“其实也没有别的意思。”
A：“那我就不好意思了。”
B：“是我不好意思。”
而GPT似乎理解了这些意思，它是如何做到的？

2.4 Emergence - 涌现

“将万事万物还原为简单基本定律的能力，并不蕴含从这些定律出发，重建整个宇宙的能力。” —— Philip Anderson.

1972年，理论物理学家Philip Anderson在Science发表了一篇名为《More is Different》[7]的论文，奠定了复杂科学的基础，安德森认为：“大量基本粒子的复杂聚集体的行为并不能依据少数粒子的性质作简单外推就能得到理解。取而代之的是在每一复杂性的发展层次之中呈现了全新的性质，从而我认为要理解这些新行为所需要作的研究，就其基础性而言，与其它相比也毫不逊色”。

回顾语言模型的结构，信息是随着注意力编码层不断往上流动的，层数越高的神经元越有能力关注那些复杂抽象的概念和难以言说的隐喻。这篇叫《在干草堆里找神经元》[8]的论文也发现了类似的情况，他们找到了一个专门用来判断语言是否为法语的神经元。如果在小模型当中屏蔽这个神经元，他对法语的理解能力马上会下降，而如果在一个大模型中屏蔽它，可能几乎没什么影响。这意味着在模型变大的过程中，一个单一功能的神经元很可能会分裂出多个适应不同情况的神经元，它们不再那么直白的判断单一问题，进而变得更难。

能理解这就是OpenAI为什么非得把模型搞得这么大的原因，只有足够大才足够抽象，而大到了一定程度，模型甚至会开始出现从未出现过的全新能力。

在这篇名为《大语言模型的涌现能力》的论文中[9]，研究人员对于这些大小不同的语言模型完成了八项新能力的测试。可以看到，他们在变大之前一直都不太行，而一旦大到某个临界点，它突然就行了，开始变成一条上窜的直线，就像是在一瞬间顿悟了一样。

纵观我们的自然和宇宙，一个复杂系统的诞生往往不是线性成长，而是在复杂度积累到某个阈值之后，突然的产生一种新的特质，一种此前从未有特的全新状态，这种现象被称作涌现，Emerge。而这个上千亿参数的大语言模型，好像真的涌现出了一些数据分类之上的新东西。

最近读了《失控》这本书，里面也提到了一个概念叫涌现，可以理解为蜂群智慧。一只蜜蜂是很笨的，但是组成一个群体就可以完成很多超越个体智慧的决策。当然我不觉得AI的单个神经元是愚笨的，而是会不会这种“意识”，也会因为大量功能迭代，学习，突然涌现出来，就像人类的进化，不知怎么的就有了意识。就像这个世界的一切都是由原子构成，但如果只是计算原子之间的相互作用力，我们永远也无法理解化学，也无法理解生命。所以，如果仅仅从还原论的角度把AI看作只做二元分裂的圆圈和线，我们就永远无法理解大语言模型今天涌现出的抽象逻辑和推理能力，为此，我们需要在一个新的层级重新理解这件事。

三、中文房间

1980年，美国哲学教授John Searle在这篇名为《心智大脑和程序》[10]的论文中提出了一个著名的思想实验，中文房间。把一个只懂英文的人关在一个封闭的房间里，只能通过传递纸条的方式和外界对话。房间里有一本英文写的中文对话手册，每一句中文都能找到对应的回复。这样房间内的人就可以通过手册顺畅的和外界进行中文对话，看起来就像是会中文一样，但实际上他既不理解外面提出的问题，也不理解他所返回的答案。

他试图通过中文房间证明，不管一个程序有多聪明或者多像人，他都不可能让计算机拥有思想、理解和意识。真的是这样吗？在这个名为互联网哲学百科全书的网站中，可以看到围绕中文房间的各种争论，他们都没能互相说服。

这些讨论都停留在思想层面，因为如果只靠一本打印出来的手册，中文房间是不可能实现的。中文对话有着无穷无尽的可能，即便是同样一句话，上下文不同，回答也不同。这意味着手册需要记录无限多的情况，要不然总有无法回答的时候。但诡异的是，ChatGPT真的实现了。作为一个只有330GB的程序，ChatGPT在有限的容量下实现了几乎无限的中文对话，这意味着他完成了对中文的无损压缩。

想象有一个这样的复读机，空间只有100MB，只能放十首歌。要听新的歌，就得删掉旧的歌。但现在我们发现了一个神奇复读机。现在只需要唱第一句，这个复读机就可以通过续写波形的方式把任何歌曲播放出来。我们应该怎么理解这个复读机？我们只能认为他学会了唱歌。

四、Compression - 压缩即智慧

回想GPT的学习过程，它所做的，就是通过它的1750亿个参数，实现了它所学习的这4990亿个token的压缩。到这一步，逐渐意识到，是压缩产生了智能。

Jack Ray, OpenAI大语言模型团队的核心成员，在视频讲座中提到，压缩一直是我们的目标。

接下来是我对于压缩及智能这件事的理解，假设我要给你发送这句话，“压缩即智慧”。

我们可以把GPT当做一种压缩工具，我用它压缩这句话，你收到后再用GPT解压，我们得先知道这句话的信息量有多大。在GBK这样的编码里，一个汉字需要两个字节，也就是16个0/1来表述，这可以表示2的16次方，也就是65536种可能。这句话一共5个字符，就需要一共80个0和1，也就是80比特。但实际上这句话的信息量是可以小于80比特的。它的真实信息量其实可以用一个公式计算。

这是1948年香农给出的信息熵的定义，它告诉我们信息的本质是一种概率密度。我们可以把这里的P简单理解为每个字出现的概率，它们出现的概率越低，整句话的信息量就越大。如果这句话里的每个字都是毫无规律的随机出现，那么P的概率就是1/65536，计算后的信息量就是原始的80比特。常见的传统压缩方法是找到重复的字，但几乎不重复的句子就很难压缩。更重要的是，正常的语言是有规律的，“压”后面跟着“缩”的概率远大于1/65536，这就给了信息进一步压缩的空间。而语言模型所做的就是在压缩的过程中找到语言的规律，提高每个字出现的概率。比如我们只发送“压缩”，让语言模型开始续写，预测的概率表里就会出现接下来的词，我们只需要选择“即”和“智慧”所在的位置，例如（402，350）。那这两这个数字就实现了信息的压缩，接收方基于这些信息，从相同语言模型的概率去处理，选出数字对应的选项，就完成了解压。2个最大不超过5000的数字，每个数字只要13位0/1就能表示，加上前2个字，一共也只需要发送52位0/1，信息压缩到原来的52/80大约65%。

相反，如果语言模型的预测效果很差，后续文字的词表还是会很长，无法实现很好的压缩效果。所以可以发现，压缩效果越好意味着预测效果越好，也就反映了模型对于被压缩信息的理解，而这种理解本身就是一种智能。为了把九九乘法表压缩的足够小，他需要理解数学，而如果把行星坐标压缩的足够小，他可能就理解了万有引力。今天，大语言模型已经成为了无损压缩的最佳方案，可以实现14倍的压缩率。压缩这一视角最大的意义在于，相比于神秘莫测的涌现，它给了我们一个清晰明确、可以量化机器智能的方案。即便面对中文房间这样的思想实验，我们也有办法研究这个房间的智能程度。

但是，通过压缩产生的智慧和人的心智真的是同一种东西吗？

五、写在最后

如果要问，现阶段GPT和人类说话方式最大的不同是什么，我认为，答案是他不会说谎。对于语言模型来说，说和想是一件事情，他只是一个字一个字的把他的思考过程和心理活动说出来了而已。GPT从不回答我不知道，因为他并不知道自己不知道，这就是AI的幻觉，看起来就像是一本正经的胡说八道，他只是想让对话继续下去，是否正确反而没那么重要。优化这个问题的方法也很简单，只需要在提问的时候多补充一句，Let’s think step by step，请逐步分析，让GPT像人一样多想几步，对他来说也就是把想的过程说出来。Step by step，这种能力也被称为Chain of Thought，思维链。心理学家Daniel Kahneman把人的思维划分成了两种，系统一是直觉、快速的、没有感觉的，系统二则需要主动的运用知识、逻辑和脑力来思考。前者是快思考，就像我们可以脱口而出八九七十二，九九八十一，而后者是慢思考。就比如要回答72乘81是多少，就必须列出过程，一步步计算。思维链的存在意味着大语言模型终于有了推理能力。而为了做到这件事，我们的大脑进化了6亿年。我们可以在6亿年前的水母身上看到神经网络最古老的运行方式。水母外围的触角区域和中心的嘴部区域都有神经元。当触角感知到食物时，这里的神经元会激活，然后把信号传给中心的神经元，食物也会被这个触角卷起来送到嘴里。漫长的岁月里，我们的大脑就在神经网络的基础上一层又一层的叠加生长出来。

首先进化出来的是爬虫类脑，这部分和青蛙的脑子有点像，它控制着我们的心跳、血压、体温这些让我们不会死的东西。然后是古生物脑，它支配着我们的动物本能，饥饿、恐惧和愤怒的情绪，繁衍后代的欲望都来自边缘系统的控制。而最外侧这两毫米左右的薄薄的一层，是最近几百万年才进化出来的新结构、新皮质，我们人类引以为傲的那些部分，语言、文字、视觉、听力、运动和思考都发生在这里，但我们对新皮质还是知之甚少。目前已知的是，这里有大概200亿个神经元，每一平方厘米的新皮质中都大约有一千万个神经元和500亿个神经元之间的连接。只需要从人类大脑外侧取下一小片三平方厘米的新皮质，就已经和ChatGPT大的吓人的参数量类似了。而我们的大脑之所以需要这么多神经元，是因为GPT仅仅需要预测下一个词，而我们的神经元需要时刻预测这个世界下一秒会发生什么。

最近几十年的神经科学研究发现除了能激活神经元的突触信号，还存在大量负责预测的树突脉冲信号。一个处于预测状态的神经元如果得到足够强的突出信号，就可以比没有预测状态的神经元更早的被激活，进而抑制其他的神经元。这意味着有一个事无巨细的世界模型就存储在我们新皮质的200亿个神经元里，而我们的大脑永远不会停止预测。所以，当我们看到一个东西，其实看到的是大脑提前构建的模型，如果它符合我们的预测，无事发生。而一旦预测错误，大量的其他神经元就会被激活，让我们注意到这个错误，并及时更新模型。所以每一次错误都有它的价值。我们也正是在无数次的预测错误和更新认知中真正认识了世界。

现在我可以试着回答最初的问题，GPT或许尚未涌现心智，但他已经拥有了智能。它是一个“大”的语言模型，是几百万个圆圈和线互相连接的分类器，是通过预测下一个词实现文字接龙的聊天大师，是不断向上抽取意义的天才金鱼，是对几千亿文字无损压缩的复读机，是不论对错永远积极回应人的助手。它可能又是一场快速退潮的科技热点，也可能是人类的最后一项重要的发明。从围棋、绘画、音乐到数学、语言、代码，当AI开始在那些象征人类智力和创造力的事情上逐渐超越的时候，给人类最大的冲击不仅仅是工作被替代的恐惧，而是一种更深层的自我怀疑。人类的心智是不是要比我们想象的浅薄的多，我不这么认为。

机器可以是一个精妙准确的复读机，而人类是一个会出错的复读机。缺陷和错误定义了我们是谁。每一次不合规矩，每一次难以理解，每一次沉默、停顿和凝视，都比不假思索的回答更有价值。

参考文献

[1] Vaswani, Ashish, et al. “Attention is all you need.” Advances in neural information processing systems 30 (2017).

[2] Radford, Alec, et al. “Language models are unsupervised multitask learners.” OpenAI blog 1.8 (2019): 9.

[3] Brown, Tom, et al. “Language models are few-shot learners.” Advances in neural information processing systems 33 (2020): 1877-1901.

[4] Rosenblatt, F. “The perceptron: A probabilistic model for information storage and organization in the brain.” Psychological Review, 65 (1958): 386–408.

[5] Radford, Alec, et al. “Improving language understanding by generative pre-training.” (2018).

[6] Bills, Steven, et al. “Language models can explain neurons in language models.” URL https://openaipublic. blob. core. windows. net/neuron-explainer/paper/index. html.(Date accessed: 14.05. 2023) (2023).

[7] Anderson, Philip W. “More Is Different: Broken symmetry and the nature of the hierarchical structure of science.” Science 177.4047 (1972): 393-396.

[8] Gurnee, Wes, et al. “Finding Neurons in a Haystack: Case Studies with Sparse Probing.” arXiv preprint arXiv:2305.01610 (2023).

[9] Wei, Jason, et al. “Emergent abilities of large language models.” arXiv preprint arXiv:2206.07682 (2022).

[10] Searle, John R. “Minds, brains, and programs.” Behavioral and brain sciences 3.3 (1980): 417-424.

你可能感兴趣的:(chatgpt,LLM,人工智能)

[LangChain 学习资源大集合] qahaj langchain 学习人工智能 python
在构建语言模型应用（LLM）时，LangChain是当前备受关注的框架之一。无论是初学者还是进阶用户，丰富的学习资源可以帮助我们高效掌握LangChain的核心概念、工具和最佳实践。这篇文章为大家整理了一些优秀的LangChain学习资源，包括官方教程、课程、短视频以及书籍。官方教程（Tutorials）1.LangChain官方教程LangChain官方提供了非常详细的初学者和进阶教程，推荐从这
MCP模型上下文协议集锦 galileo2016 人工智能
MCP模型上下文协议简介MCP模型上下文协议（Model-Context-Protocol，MCP），能够实现大型语言模型（LLM）应用程序与本地或远程资源之间的安全、可控的交互。2024年11月底，Anthropic公司发布了MCP开放标准，实现大型语言模型（LLM）应用程序与外部数据源和工具之间的无缝集成。官方网站:https://modelcontextprotocol.io项目仓库:Mod
Open WebUI：开源AI交互平台的全面解析
目录核心功能安装指南Linux/macOSWindows进阶特性管理与安全生态系统集成持续更新核心功能️交互体验类ChatGPT界面:提供直观的聊天界面设计跨平台响应式设计:完美适配桌面/移动端即时响应:毫秒级响应速度富文本支持:代码语法高亮完整Markdown/LaTeX渲染语音输入支持（支持静音自动提交）模型管理多模型切换:支持不同LLM模型即时切换GGUF模型创建:支持直接上传/从Huggi
大模型时代的软件架构设计 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
引言当今世界，人工智能（AI）技术正以惊人的速度发展，其中大模型（LargeModels）的崛起尤为引人注目。大模型，也被称为深度学习模型，因其庞大的参数规模和强大的数据处理能力，成为推动AI技术前进的重要力量。随着大模型的广泛应用，软件架构设计面临着前所未有的挑战和机遇。大模型时代的软件架构设计，不仅需要解决传统软件架构所面对的问题，如性能、可靠性和可扩展性等，还需要应对大模型带来的新挑战，如计
大语言模型LLM原理篇_图解大模型从用户输入prompt到llm输出答案的流程原理喝不喝奶茶丫 prompt 人工智能自然语言处理语言模型 javascript 大模型 LLM
大模型席卷全球，彷佛得模型者得天下。对于IT行业来说，以后可能没有各种软件了，只有各种各样的智体（Agent）调用各种各样的API。在这种大势下，笔者也阅读了很多大模型相关的资料，和很多新手一样，开始脑子里都是一团乱麻，随着相关文章越读越多，再进行内容梳理，终于理清了一条清晰的脉络。笔者写原理篇时心情是有些惴惴不安的，因为毕竟对大模型的研究有限，缺乏深度。但是，还是觉得有必要记录一下学习理解心得，
开发基于提示工程的大语言模型（LLM）应用——学习笔记 ricky_fan 人工智能 python
本文是学习笔记。学习通过提示工程与大语言模型进行程序化的交互。将从最基本的开始，比如使用哪些模型，以及如何向它们发送提示词并查看响应。将逐步构建更复杂的提示词，并学习LangChain为我们提供的、用于与大语言模型交互的丰富工具。Langchain链核心是运行时（runnable），它们能以多种方式组合的为工作流。如何创建LangChain链 fromlangchain_nvidia_ai_end
《AI大模型开发笔记》——提示词工程 Richard Chijq AI大模型开发笔记前端服务器运维
1.什么是提示工程提示工程（PromptEngineering），也被称为上下文学习，是指通过精心设计的提示技术来引导LLM行为，而无需更改模型权重。其目标是使模型输出与给定任务的人类意图一致。提示工程帮助用户控制语言模型输出，生成适合的特定需求。提示调整提供了对模型行为的直观控制，但对提示的确切措辞和设计敏感，因此需要精心制定的准则以实现期望的结果。2.提示工程的原则2.1.给模型清晰指令：
[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案心心喵论文笔记剪枝算法机器学习
https://github.com/sramshetty/ShortGPT/tree/mainMy剪枝方案（暂定）：剪枝目标：1.5B—>100～600M剪枝方法：层粒度剪枝1、基于BI分数选择P%的冗余层，P=60~802、对前N%冗余层，直接删除fulllayer。N=20（N：剪枝崩溃临界点，LLaMA2在45%，Mistral-7B在35%，Qwen在20%，Phi-2在25%）对后(P
GitHub每日最火火火项目（2.28） FutureUniant github日推 github 人工智能计算机视觉音视频 ai
olmocr项目介绍：olmocr是由allenai开发的一款用于将PDF文件线性化，以适配大语言模型（LLM）数据集和训练的工具包。在大语言模型的训练过程中，数据的格式和预处理极为关键。PDF文件作为常见的数据来源，其内部复杂的排版和结构使得其中的文本信息难以直接被模型有效利用。olmocr通过一系列的技术和算法，对PDF文件进行处理，将其中的文本内容按照合适的顺序和格式提取出来，转化为线性的、
GitHub 星标10W+的大模型书籍：《轻松入门大模型应用开发：GPT-4 和 ChatGPT 实战指南》，25年一书通关LLM大模型程序员丸子人工智能语言模型自然语言处理大模型 AI LLM 大模型应用
当下大模型这么火，还有人很多人想加入进来，但是不知道怎么去学习，那么今天我就给大家分享一本适合所有人的一本神仙级入门大模型的书籍，小白也能学会。它是由奥利维耶·卡埃朗和玛丽-艾丽斯·布莱特合著的一本《大模型应用开发极简入门：基于GPT-4和ChatGPT》，为初学者提供一份清晰、全面的“可用知识”，帮助读者快速了解GPT-4和ChatGPT的工作原理及优势。此书使用流行的Python编程语言来构建
Crawl4AI：开源的网络爬虫和抓取工惟贤箬溪穷玩Ai github 开源 ai
crawl4ai是一个开源项目，旨在帮助用户爬取GitHub上与AI（人工智能）相关的内容。这些内容通常包括AI相关的开源项目、库、资源、论文、教程等。项目提供了一个爬虫工具，可以自动化地抓取并提取GitHub上与人工智能相关的资源。以下是对该项目的详细解读：1.项目概述crawl4ai是一个爬虫框架，专门用于从GitHub上抓取与AI相关的开源项目或仓库。这些仓库包括AI领域的机器学习、深度学习
大模型研究：DeepSeek三个版本（初级中级高级）资源要求说明程序猿学长大模型人工智能语言模型
以下是DeepSeek-LLM7BChat、DeepSeek-V3、DeepSeek-LLM6.7B三个版本模型所需硬件资源的介绍：DeepSeek-LLM6.7B最小最基础版本1.内存（RAM）非量化运行时，由于模型参数数量相对较少，大约需要13GB-14GB的系统内存来加载模型和进行基本推理。如果使用8位量化技术（将模型参数从32位浮点数转换为8位整数），内存需求可降低至约7GB；使用4位量化
如果GPT-4还只是阿米巴原虫，未来的霸王龙会是什么样？| 赫拉利《智人之上》量子位
关注前沿科技量子位几乎所有人都已经发现，我们正生活在一场前所未有的信息革命之中。但这到底是一场怎样的革命？最近这几年，太多突破性的发明如洪水般滚滚而来，以至于我们很难判断到底是什么推动了这场革命。是互联网？智能手机？社交媒体？区块链？算法？还是人工智能？所以，在讨论目前这场信息革命的长期影响之前，让我们先回顾一下它的基础。本文分为三大部分，分别为：我们真的了解计算机吗？计算机正在塑造一个全新的信息
MoneyPrinterTurbo：AI驱动的全自动高清短视频生成框架萧鼎机器学习算法与实战人工智能音视频 python
引言在数字化时代，短视频已经成为信息传播的重要形式。无论是社交媒体、自媒体创作者，还是品牌营销和广告投放，短视频都占据了越来越重要的地位。然而，传统视频制作的门槛较高，需要专业的剪辑技能、素材采集以及后期处理，导致许多个人创作者和中小企业难以持续产出高质量内容。MoneyPrinterTurbo正是针对这一痛点而生的一款全自动短视频生成框架。它采用人工智能技术，从文案撰写到视频合成实现了全流程自动
Open WebUI：开源AI交互平台的全面解析
目录核心功能安装指南Linux/macOSWindows进阶特性管理与安全生态系统集成持续更新核心功能️交互体验类ChatGPT界面:提供直观的聊天界面设计跨平台响应式设计:完美适配桌面/移动端即时响应:毫秒级响应速度富文本支持:代码语法高亮完整Markdown/LaTeX渲染语音输入支持（支持静音自动提交）模型管理多模型切换:支持不同LLM模型即时切换GGUF模型创建:支持直接上传/从Huggi
速来！人工智能未来设计大赛· 大模型专项竞技赛火热报名中！量子位
技术革新临界点已至，大模型生态迎来爆发期当前，全球人工智能产业正经历从“暴力美学”到“精巧工程”的范式跃迁。DeepSeek引领超强大模型的开源开放与普惠化浪潮之下，大模型技术已突破边界逐步渗透至千行百业，成为驱动产业升级的新引擎。种种迹象无不表明大模型应用爆发临界点已近在眼前。值此历史性时刻，由工业和信息化部工业文化发展中心主办的“人工智能未来设计大赛·大模型专项竞技赛”正式启动，诚邀全球大模型
阿里云PAI大模型RAG对话系统最佳实践阿里云云栖号云栖号技术分享阿里云云计算云原生 ai 人工智能
去年4月至9月，阿里云人工智能平台PAI团队与大数据基础工程技术团队合作，构建了基于知识库检索增强的大模型答疑对话机器人，并在阿里云官方答疑链路、研发小蜜、钉钉大数据技术服务助手等多个线上场景上线，显著提升答疑效率。相关文档：【万字长文】基于阿里云PAI搭建知识库向量检索增强的大模型对话系统上线几个月来，随着RAG技术日趋火热，我们保持对线上链路的迭代，不断加入学界业界最新的RAG优化技术（eg:
继清华大学DeepSeek资料后，北京大学也出了内容主攻提示词和应用场景心灵宝贝 deepseek
这份文件是北京大学关于DeepSeek与AIGC应用的内部研讨系列讲座内容，主要介绍了DeepSeek-R1模型的技术特性、应用场景以及AIGC（人工智能生成内容）的概念、应用和未来趋势。以下是文件的主要内容摘要：1.DeepSeek-R1模型详解技术特性：DeepSeek-R1是一款专注于复杂推理任务的推理模型，擅长数学、编程和自然语言推理任务。其低成本、开源策略和卓越的推理能力使其在AIGC领
人工智能丨ChatGPT 免费开放网络搜索，能否挑战 Google 的搜索霸主地位？霍格沃兹测试开发学社测试人社区人工智能 chatgpt
近年来，人工智能的快速发展改变了许多行业，尤其是在信息获取和搜索领域。随着OpenAI推出的ChatGPT系统，它的功能不断增强，而一个重要的新变化是——ChatGPT的网络搜索功能现在对所有用户免费开放。这一变革有可能颠覆Google多年来在搜索引擎领域的统治地位。那么，ChatGPT如何通过这一免费搜索功能重新定义信息搜索方式呢？ChatGPT的网络搜索功能ChatGPT最初是一个文本生成工具
2025 AI展望：Scaling Law新叙事加速AI变革阿里巴巴淘系技术团队官网博客人工智能
我们正身处一场技术革命的历史开端，以ChatGPT为标志的这轮AI科技浪潮是算法和软件诞生以来人类科技最重要的技术变革，由此开启了以智能为核心的第四次工业革命。这次AI变革是由以ScalingLaw为底层逻辑的基础模型驱动，其整体的发展脉络由基础模型的技术逻辑主导。进入2025年，我们清晰地看到，ScalingLaw本身仍然成立，但以堆算力以及一味追求扩大模型尺寸的迭代路径已经被打破。同时，基础模
DeepSeek 解决实际问题，提升自己的技术水平和应用能力 2501_90739749 pdf
资源链接：https://pan.quark.cn/s/3d4088555ca0资源链接：https://pan.quark.cn/s/df8ce3ea6f4e「DeepSeek资料大全」资源链接：https://pan.quark.cn/s/1352425b0645「完整版Dee...键整合包」链接：https://pan.quark.cn/s/7e851bca2dc2在人工智能领域风起云涌、技
谁说消费级硬件不能玩 DeepSeek - R1 微调？手把手教你进阶AI玩家硅基创想家 #大模型-DeepSeek系列人工智能 DeepSeek 大模型微调大模型 GPU
微调像DeepSeek-R1这样的大规模人工智能模型可能需要大量资源，但借助正确的工具，在消费级硬件上进行高效训练是可行的。让我们来探索如何使用LoRA（低秩自适应）和Unsloth来优化DeepSeek-R1的微调，实现更快、更具成本效益的训练。一、大规模人工智能模型的微调DeepSeek最新的R1模型在推理性能方面树立了新的标杆，在保持开源的同时，可与专有模型相媲美。DeepSeek-R1的蒸
一个游戏程序员的学习资料【转载】 Snail -Bernoulli 游戏程序员游戏程序员成长路线
想起写这篇文章是在看侯杰先生的《深入浅出MFC》时,突然觉得自己在大学这几年关于游戏编程方面还算是有些心得，因此写出这篇小文,介绍我眼中的游戏程序员的书单与源代码参考。一则是作为自己今后两年学习目标的备忘录,二来没准对别人也有点参考价值。我的原则是只写自己研究过或准备研究的资料，所以内容无疑会带上强烈的个人喜好色彩,比如对网络,数据库等重要方面完全没有涉及。因为自己主要对三维图形引擎,人工智能算法
一文看懂 Claude 3.7 Sonnet，为什么是第一个融合推理模式的 AI 模型董董灿是个攻城狮人工智能
1.Claude3.7Sonnet有何特别之处？Claude3.7Sonnet是Anthropic最新发布的AI模型，发布过程中，最突出最吸引眼球的特点是首个“融合推理”模型。什么是融合推理模型？简单来说，这个AI既能快速响应问题，也能进行深度思考，并且允许用户控制思考的深度和时长。这种设计让AI更加接近人类的思考模式，能够在不同情境下灵活调整回答方式。传统的大语言模型（LLM）通常有两种工作方式
Bedrock Claude Chat: 基于AWS Bedrock和Claude的智能聊天机器人 2401_87458778 aws 机器人云计算
BedrockClaudeChat:智能聊天的新选择在人工智能和自然语言处理技术飞速发展的今天，智能聊天机器人正在各行各业得到广泛应用。AWS推出的BedrockClaudeChat项目为开发者提供了一个强大而灵活的聊天机器人解决方案，让构建智能对话系统变得前所未有的简单。项目概述BedrockClaudeChat是一个基于AmazonBedrock平台和Anthropic公司Claude大语言模
2001-2022年上市公司数字赋能指数（TF-IDF）数据：评估企业数字化转型的关键指标小王毕业啦大数据 tf-idf 大数据社科数据人工智能
上市公司数字赋能指数（TF-IDF）数据：评估企业数字化转型的关键指标上市公司数字赋能指数是一个衡量企业利用数字技术提升业务能力和效率的综合性指标。该指数通过量化分析企业在大数据、云计算、人工智能等数字技术应用方面的能力，反映企业数字化转型的深度和广度。获取数据点这里：2001年-2022年上市公司-数字赋能指数（TF-IDF）（Excel+dta）数字赋能指数的重要性数字化转型：推动企业实现数字
2025智能系统工程-中国人工智能系列白皮书报告200+份汇总解读|附PDF下载数据挖掘深度学习人工智能算法
原文链接：https://tecdat.cn/?p=40836在当今科技飞速发展的时代，人工智能正以前所未有的速度渗透到各个行业，深刻改变着人们的生活与工作方式。本报告汇总解读聚焦智能系统工程这一前沿领域，深入剖析其发展现状、关键技术、应用实践及未来趋势。本报告汇总洞察基于文末269份人工智能行业研究报告的数据，报告合集已分享在交流群，阅读原文进群和500+行业人士共同交流和成长。报告首先对智能系
【llm对话系统】大模型源码分析之 LLaMA 模型的 Masked Attention kakaZhui llama 人工智能 AIGC chatgpt python
在大型语言模型（LLM）中，注意力机制（AttentionMechanism）是核心组成部分。然而，在自回归（autoregressive）模型中，例如LLaMA，我们需要对注意力进行屏蔽（Masking），以防止模型“偷看”未来的信息。本文将深入探讨LLaMA模型中MaskedAttention的实现逻辑，并对比其他类型大模型中常用的MaskedAttention方案。1.什么是MaskedAt
全套清华大学DeepSeek教程来袭 2501_90771721 pdf
资源链接：https://pan.quark.cn/s/3d4088555ca0资源链接：https://pan.quark.cn/s/df8ce3ea6f4e「DeepSeek资料大全」资源链接：https://pan.quark.cn/s/1352425b0645「完整版Dee...键整合包」链接：https://pan.quark.cn/s/7e851bca2dc2在当今这个人工智能飞速发展
Python从0到100（六十八）：Python OpenCV-图像边缘检测及图像融合是Dream呀 opencv python 计算机视觉
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p