碳学长

生成式人工智能笔记-AIGC笔记

十多年前，人工智能还只是一个不被人看好的小众领域，但是现在，它却已经成了街头巷尾的热点谈资，几乎任何事情都可以和人工智能联系在一起。

人工智能包括基础层、技术层和应用层。

基础层是人工智能产业的基础，为人工智能提供数据及算力支撑；

技术层是人工智能产业的核心，主要包括各类模型和算法的研发和升级；

应用层则是人工智能面向特定场景需求而形成的软硬件产品或解决方案。

决策式 AI 和生成式 AI

人工智能可从不同的维度进行划分。如果按其模型来划分（人工智能是由模型支撑的）可以分为决策式AI和生成式AI。

决策式AI

决策式AI（也被称作判别式AI）学习数据中的条件概率分布，即一个样本归属于特定类别的概率，再对新的场景进行判断、分析和预测。决策式AI有几个主要的应用领域：人脸识别、推荐系统、风控系统、其他智能决策系统、机器人、自动驾驶。

生成式AI

生成式AI则学习数据中的联合概率分布，即数据中多个变量组成的向量的概率分布，对已有的数据进行总结归纳，并在此基础上使用深度学习技术等，创作模仿式、缝合式的内容，相当于自动生成全新的内容。

不管是哪种类型的模型，它的基础逻辑是一致的：AI模型从本质上来说是一个函数，要想找到函数准确的表达式，只靠逻辑是难以推导的，这个函数其实是被训练出来的。

从宏观角度来看，决策式AI是一种用于决策的技术，它利用机器学习、深度学习和计算机视觉等技术来处理专业领域的问题，并帮助企业和组织优化决策。

而生成式AI则是一种用于自动生成新内容的AI技术，它可以使用语言模型、图像模型和深度学习等技术，自动生成新的文本、图片、音频和视频内容。

因此，决策式AI可以说是在对人类的决策过程进行模仿，但生成式AI就聚焦在创作新内容上。

从大数据到大模型

大数据指的是海量的数据。

在人工智能领域，通过大量的数据来训练模型。拥有海量参数的模型都被称为“大模型

大模型能分析处理海量的数据，在解决问题上取得更好的效果。

生成式AI就是大模型的产物。

目前，“内容”生产经历了四次迭代：

PGC(professional generated content)

PGC(professional generated content)，即“专业生产内容”，主要指具备专业背景的内容生产者所创造的内容

UGC(user generated content)

UGC(user generated content)，“用户生产内容”，其内容的源头更偏大众化，人人都可作为用户进行内容生产

AIUGC(artificially intelligent UGC)

AIUGC则为人工智能与UGC的结合，人工智能参与到了用户创作内容的过程中

AIGC

与PGC、UGC和AIUGC不同的是，在AIGC的概念中，“无生命的”人工智能成了完全的内容源头，“无生命主体”成了为人类创作内容的生产者。

AIGC就是利用人工智能自动生成内容的生产方式，它可以在生成式AI模型、训练数据等的基础上，生成文本、图片、音频、视频、代码等多样化内容，这种快速的内容生产方式给市场注入了令人兴奋的新鲜血液。

生成式 AI 和决策式 AI 聚焦于不同的认知层面

生成式AI还渗透到了3D领域，Magic3D就是GPU（图形处理器）制造商英伟达推出的一款应用，它会先用低分辨率粗略地对事物进行3D建模，然后进阶优化为更高分辨率。OpenAI的Dream Fields更是不需要照片就能生成3D模型，把“无中生有”玩得透彻。

生成式AI通过学习数据中的联合概率分布，对已有的数据进行总结归纳，再创作出新的内容。

ChatGPT的“前世”与Transformer（变换器）模型关系紧密，而Transformer模型诞生于2017年。

2017年，谷歌大脑团队在神经信息处理系统大会发表了一篇名为《注意力是你所需要的全部》(Attention Is All You Need)的论文。这篇论文的作者在文章中第一次提出了一个基于注意力机制的Transformer模型，并且把这个模型首次用在理解人类的语言上，这就是自然语言处理。谷歌大脑团队利用非常多已经公开的语言数据集来训练这个最初的Transformer模型，而这个Transformer模型包括6500万个可调参数。

经过大量的训练后，这个Transformer模型在英语成分句法分析、翻译准确度等多项评分上都在业内达到了第一的水准，世界领先，成为当时最为先进的大型语言模型。

仅几年内，这个模型的影响力就已经渗透到人工智能的各个领域，包括多种形式的自然语言模型，以及预测蛋白质结构的AlphaFold 2模型等。也就是说，它就是后续许多功能强大的AI模型的源头。

在Transformer模型被推出还不足一年的2018年，OpenAI公司有了自己的技术突破，他们发表了论文《用生成式预训练提高模型的语言理解力》(Improving Language Understanding by Generative Pre training)，还推出了具备1.17亿个参数的GPT-1模型。GPT-1模型是一个基于Transformer结构的模型，但训练它的数据集更为庞大。

最终训练出的模型GPT-1，在文本分类、问答、文本相似性评估、蕴含语义判定这四个评价维度上，都取得了比基础Transformer模型更好的结果，因此也取代Transformer模型，摇身一变成为新的业内龙头。

接着，GPT-2，GPT-3，GPT-… 不断推出。

在2022年神经信息处理系统大会中，OpenAI公司再次向大家宣布了它的新突破，它又推出了全新的大型语言预训练模型：ChatGPT。GPT-3.5是ChatGPT的前身，也是OpenAI对GPT-3模型进行微调后开发出来的模型，在GPT-3.5诞生后，ChatGPT才横空出世。

AIGC 的底层逻辑

人工智能的发展，技术上最大的功臣就是深度学习。

深度学习的爆发式增长则得益于海量的数据、图形处理器带来的强大算力以及模型的持续改进。

2006年，计算机科学家、认知心理学家杰弗里·辛顿(Geoffrey Hinton)首次提出了“深度信念网络”。与传统的训练方式不同，深度信念网络有一个“预训练”(pre-training)的过程，可以方便地让神经网络中的权值找到一个接近最优解的值，之后再使用“微调”(fine-tuning)来对整个网络进行优化训练。这种分阶段的训练方法大幅度减少了训练深度学习模型的时间。

深度学习的前世今生

机器学习是人工智能的分支，它专门研究计算机如何模拟和实现人类的学习行为。

深度学习是机器学习的一种。

深度学习的概念最初起源于人工神经网络(artificial neural networks)。

人工神经网络

人工神经网络是一种模仿人类神经网络来进行信息处理的模型，它具有自主学习和自适应的能力。

1943年，数学家皮茨(Pitts)和麦卡洛克(McCulloch)建立了第一个神经网络模型M-P模型，能够进行逻辑运算，为神经网络的发展奠定了基础。

生物神经元一共由四个部分组成：细胞体、树突、轴突和轴突末梢。M-P模型其实是对生物神经元结构的模仿。

神经元及M-P模型示意图

20世纪80年代，人工智能科学家拉姆梅尔哈特(Rumelhart)、威廉斯(Williams)、辛顿、杨立昆(Yann LeCun)等人发明的多层感知机解决了【对复杂函数的预测】的难题，推动了人工神经网络的进一步发展。

20世纪90年代，诺贝尔奖获得者埃德尔曼(Edelman)提出Darwinism模型并建立了一种神经网络系统理论。他从达尔文的自然选择理论中获得启发，将其与大脑的思维方式联系在了一起，认为“面对未知的未来，成功适应的基本要求是预先存在的多样性”，这与我们现在谈论较多的模型训练和预测方式相契合，对90年代神经网络的发展产生了重大意义。

深度学习

直到2006年，被称为“人工智能教父”的辛顿正式提出了深度学习的概念，认为通过无监督学习和有监督学习相结合的方式可以对现有的模型进行优化。这一观点的提出在人工智能领域引起了很大反响，许多像斯坦福大学这样的著名高校的学者纷纷开始研究深度学习。2006年被称为“深度学习元年”。

2009年，深度学习应用于语音识别领域。

2012年，深度学习模型AlexNet在ImageNet图像识别大赛中拔得头筹，深度学习开始被视为神经网络的代名词。

同样是在这一年，人工智能领域权威学者吴恩达教授开发的深度神经网络将图像识别的错误率从26%降低到了15%，这是人工智能在图像识别领域的一大进步。

2014年，脸书开发的深度学习项目DeepFace在识别人脸方面的准确率达到了97%以上。

2016年，基于深度学习的AlphaGo在围棋比赛中战胜了韩国顶尖棋手李世石，在世界范围内引起轰动，这一事件不但使深度学习受到了认可，人工智能也因此被社会大众熟知。

2017年，深度学习开始在各个领域展开应用，如城市安防、医学影像、金融风控、课堂教学等。

一直到最近的现象级产品ChatGPT，它在不知不觉中已经渗透到我们的生活中。

深度学习的经典模型

深度学习是建立在计算机神经网络理论和机器学习理论上的科学，它使用建立在复杂网络结构上的多处理层，结合非线性转换方法，对复杂数据模型进行抽象，能够很好地识别图像、声音和文本。

深度学习的两种经典模型：CNN 和 RNN

CNN 卷积神经网络

CNN的全称是convolutional neural network，也就是卷积神经网络。

卷积神经网络共分为以下几个层级部分：输入层(input layer)、卷积层(convolution layer)、池化层(pooling layer)、全连接层(fully connected layer)。

卷积神经网络工作过程示意图

输入层

对图像进行简单处理，如降低图像维度，便于图像识别

卷积层

卷积层的神经元对图像进行各个维度的特征提取。

针对的是图像的局部进行特征提取：如需要识别图像中的小狗，神经元只负责处理狗的耳朵、眼睛等。

卷积层对图像进行不同尺度的特征提取，大大丰富了获取特征的维度，有助于提升最终识别的准确度。

池化

对图像进行压缩降维，减少图像识别需要处理的数据量。

全连接

将前面提取出来的所有图像特征连接组合起来：如将提取到的小狗的头部、身体、腿部等局部特征组合起来，形成完整的包含小狗的特征向量，然后识别出类别。

卷积神经网络的三个特点

1、每个神经元只需要聚焦图像的一小部分，而不是图像的全部，识别难度降低

2、卷积层的神经元可以应用于不同的图像识别任务（如训练好的可以识别小狗的神经元也可以继续识别其他相似物体）

3、图像特征维度降低但保留了图像主要特征，减少了数据量。

所以，卷积神经网络特别适合于图像识别。

卷积神经网络图像识别过程示意图

RNN 循环神经网络

RNN的全称是recurrent neural network，也就是循环神经网络。对循环神经网络的研究最早出现于20世纪80年代末，由几位神经网络专家提出，该模型经常用于时序信号（如语音）的识别和理解。

循环就是重复的意思，循环神经网络模型在运行时会对同一个序列进行循环重复的操作。序列是被排成一列的对象，序列中的元素相互依赖，排列顺序非常重要，比如时序数据、对话等，一旦顺序错乱，含义和作用都会发生巨大改变。循环神经网络解决了卷积神经网络不能很好地识别连续性事件（一段连续的话、一个语言故事，“小明每次去超市都会买很多苹果，因为他喜欢吃（）”，这个问题的答案是很容易推测出“苹果”，但人工神经网络和卷积神经网络却很难联系上下文，给出答案，循环神经网络就是对它们不足之处的弥补）的问题，在深度学习领域发挥着不可替代的作用。

循环神经网络之所以能对连续性事件进行识别，是因为它不仅将当前的输入数据作为网络输入，还将之前感知到的数据一并作为输入。根据记忆的长短，从第一层开始，将激活传递到下一层，以此类推，最后得到输出结果。

一个循环神经网络由输入层、隐藏层和输出层三部分组成。

循环就发生在隐藏层。

隐藏层里一般会设置一个特定的预测函数，当我们向循环神经网络模型输入一个连续性事件后，在隐藏层的这个函数就会进行运算，这个运算结果又可以作为输入进入隐藏层再一次进行运算。如此这般，就形成了一个不断循环的预测，这个预测既与新输入的数据有关，也取决于每一次循环的输入。

循环神经网络原理示意图

GAN 生成式对抗网络

GAN的全称是generative adversarial networks，即生成式对抗网络，由伊恩·古德费洛(Ian Goodfellow)等人在2014年提出，此后各种花式变体，如CycleGAN、StyleGAN等层出不穷，在“换脸”“换衣”等场景下生成的图片和视频足以以假乱真。2020年，PaddleGAN实现的表情迁移模型能用一张照片生成一段唱歌视频，使“蚂蚁呀嘿”等各种搞笑视频火遍全网。

生成式对抗网络是基于无监督学习方法的一种模型，即通过两个神经网络相互博弈的方式进行学习，这两个神经网络一个是生成网络，另一个是判别网络。

生成网络从潜在空间中随机取样作为输入，生成网络接收噪声向量，再将这个噪声向量转换为虚拟数据，其输出结果需要尽量模仿训练集中的真实样本，然后将虚拟数据发送到判别网络进行分类。

而判别网络的输入则为真实样本和生成网络的输出结果，其工作是将生成网络的输出与真实样本区别开来。两个网络相互对抗、不断调整参数，最终达到生成网络的输出结果与真实样本无二。

GAN 网络架构示意图

噪声向量

何为噪声？

简单说，如下图，我们要识别图片中的“水”，那么“沙漠”就是噪声。

再比如一张图片里有猫和狗，我们要识别猫，那么图片中的狗就是噪声。

在深度学习中，训练时往往会在输入数据中加入噪声，以提高模型的鲁棒性和泛化能力。这称为数据扩充。通过向输入数据添加噪声，模型被迫学习对输入中的微小变化具有鲁棒性的特征，这可以帮助它在新的、看不见的数据上表现更好。

鲁棒性也称为健壮性，指控制系统在一定（结构，大小）的参数摄动下，维持其它某些性能的特性。

GAN生成器Generator的输入是随机噪声，目的是每次生成不同的图片。但如果完全随机，就不知道生成的图像有什么特征，结果就会不可控，因此通常从一个先验的随机分布产生噪声。常用的随机分布：

高斯分布：连续变量中最广泛使用的概率分布；
均匀分布：连续变量x的一种简单分布。

引入随机噪声使得生成的图片具有多样性，比如下图不同的噪声z可以产生不同的数字：

所以噪声的作用就是，保证生成的图片不同但又在合适区间内（不是完全随机）。即保证结果不同且可控、可靠。

生成式对抗网络的通俗原理

通俗来说，GAN的工作原理类似于这样的场景：

一个男生试图拍出摄影师级别的照片，而一个女生要找出照片的瑕疵。
这个过程是男生先拍出一些照片，然后由女生分辨出男生拍的照片与摄影师级别的照片的区别。
男生再根据反馈改进自己的拍摄技术和方法，拍出一些新的照片，女生再对这些新照片继续提出修改意见。
直到达到均衡状态——女生无法再分辨男生拍的照片与摄影师级别的照片有什么区别。

通过这种方式，GAN能够从多个维度学习到大量无标注数据的特性。以往的模型训练过程，要标注员将输入数据打上标签之后，模型才开始进行学习；

而利用生成网络和判别网络之间的相互对抗，GAN可自发学习输入数据的规律，确保生成结果接近训练集中的真实样本，从而实现无标注数据的学习。

其实，GAN和所有的生成式模型都一样，目标就是拟合训练数据的分布，对于图片生成任务来说，就是拟合训练集图片的像素概率分布。

GAN模型实现图片的风格迁移

Transformer：从序列到序列 seq2seq

Transformer是“转换器”的意思。这也正是Transformer的核心，也就是它能实现的功能——从序列到序列。但这个从序列到序列，可不是简单地从一个词跳到另一个词，中间要经过很多道“工序”，才能实现想要的效果。

序列（翻译自英文 sequence），指的是文本数据、语音数据、视频数据等一系列具有连续关系的数据。不同于图片数据，不同图片之间往往不具有什么关系，文本、语音和视频这种数据具有连续关系。这些数据在这一时刻的内容，往往与前几个时刻的内容相关，同样也会影响着后续时刻的内容。

序列到序列的问题示例

序列到序列模型一般是由编码器(encoder)和解码器(decoder)组成的。其工作流程可以简单描述为，在编码器侧对输入序列进行编码，生成一个中间的语义编码向量，然后在解码器侧对这个中间向量进行解码，得到目标输出序列。

以中译英场景为例，编码器侧对应的输入是一段中文序列，解码器侧对应的输出就是翻译出来的英文序列。

编解码机制结构图

在实际应用过程中，序列到序列模型的输入输出数据可以是不同形式的数据，对应的编码器侧和解码器侧采用的模型结构可以是不同的。

序列到序列模型看似非常完美，但是在实际使用的过程中仍然会遇到一些问题。比如在翻译场景下，如果句子过长，会产生梯度消失的问题。由于解码时使用的是最后一个隐藏层输出的定长向量，那么越靠近末端的单词会被“记忆”得越深刻，而远离末端的单词则会被逐渐稀释掉，最终模型输出的结果也因此不尽如人意。面对这些问题，研究人员也提出了对应的解决方案，比如加入注意力(attention)机制。

Transformer：注意力机制

传统的编码器—解码器架构对序列长度有限制，本质原因是它无法体现对一个句子序列中不同词语的关注程度。在不同的自然语言处理任务中，一个句子中的不同部分是有不同含义和重要性的，比如“我喜欢这本书，因为它讲了很多关于养花的知识”这句话：如果对这句话做情感分析，训练的时候明显应该对“喜欢”这个词语进行更多的关注；而如果基于书的内容进行分类，我们应该更关注“养花”这个词。这就涉及我们接下来要谈的注意力机制，这其实是借鉴了人类的注意力思维方式：人类从直觉出发，能利用有限的注意力，从大量信息中快速获取最有价值的信息。

注意力机制通过计算编码器端的输出结果中每个向量与解码器端的输出结果中每个向量的相关性，得出若干相关性分数，再进行归一化处理将其转化为相关性权重，用来表征输入序列与输出序列各元素之间的相关性。注意力机制训练的过程中，不断调整、优化这个权重向量，最终目标就是要帮助解码器在生成结果时，对于输入序列中每个元素都能有一个合理的相关性权重参考。

自注意力机制是注意力机制的一种变体。它减少了对外部信息的依赖，更擅长捕捉数据或特征的内部相关性。例如这样一句英文：“He thought it was light before he lifted the backpack.”（在举起这个背包之前，他觉得它是轻的。）这里“light”的意思是“灯”还是“轻的”呢？这就需要我们联系上下文来理解。我们在看到“backpack”之后就应该知道，这里的“light”很大概率指的是“轻的”。自注意力机制会计算每个单词与其他所有单词之间的关联，在这句话里，当翻译“light”一词时，“backpack”一词就有较高的相关性权重。

Transformer 模型

Transformer模型在普通的编码器—解码器结构基础上做了升级，它的编码端是由多个编码器串联构成的，而解码端同样由多个解码器构成。

它同时也在输入编码和自注意力方面做了优化，例如采用多头注意力机制、引入位置编码机制等等，能够识别更复杂的语言情况，从而能够处理更为复杂的任务。

Transformer 网络结构图

Transformer 编解码器内部结构图

多头注意力(multi-head attention)。简单点说，不同标记相互之间的注意力通过多个注意力头来实现，而多个注意力头针对标记之间的相关性来计算注意力权重）。

如在一个句子中，某个注意力头主要关注上一个单词和下一个单词的关系，而另一个注意力头就会把关注点放在句子中动词和其对应宾语的关系上。

而在实际操作中，这些注意力头的计算都是同步进行的，这样整体反应速度就会加快。这些注意力头的计算完成以后会被拼接在一起，由最终的前馈神经网络层进行处理后输出。

“The monkey ate the banana quickly and it looks hungry.”（猴子快速地吃了香蕉，它看起来很饿。）这句话中的“it”指的是什么？是“banana”还是“monkey”？

在多头注意力机制中，其中一个编码器对单词“it”进行编码时，可能更专注于“monkey”，而另一个编码器的结果可能认为“it”和“banana”之间的关联性更强，这种情况下模型最后输出的结果较大可能会出现偏差。这时候多头注意力机制就发挥了作用，有其他更多编码器注意到“hungry”，通过多个编码结果的加权组合，最终单词“hungry”的出现将导致“it”与“monkey”之间产生更大的关联性，也就最大限度上消除了语义理解上的偏差。

位置编码(positional encoding)机制也是Transformer特有的。在输入的时候，加上位置编码的作用在于计算时不但要知道注意力聚焦在哪个单词上面，还需要知道单词之间的相对位置关系。例如：“She bought a book and a pen.”（她买了书和笔。）这句话中的两个“a”修饰的是什么？是“book”还是“pen”？意思是“一本”还是“一支”？

如果只使用自注意力机制，可能会忽略两个“a”和它们后面名词之间的关系，而只关注“a”和其他单词之间的相关性。引入位置编码就能很好地解决这个问题。通过加入位置编码信息，每个单词都会被加上一个表示它在序列中位置的向量。这样，在计算相关性时，模型不仅能够考虑单词之间的语义相关性，还能够考虑单词之间的位置相关性，也就能够更准确地理解句子中每个单词所指代或修饰的对象。

多头注意力机制关注的是语义相关性，位置编码机制关注的是位置相关性。

通过引入多头注意力机制、位置编码等方式，Transformer有了最大限度理解语义并输出相应回答的能力，这也为后续GPT模型这种大规模预训练模型的出现奠定了基础。

GPT 系列模型

一般的神经网络在进行训练时，先对网络中的参数进行随机初始化，再利用算法不断优化模型参数。

GPT属于典型的“预训练+微调”两阶段模型。

GPT的训练方式是，模型参数不再是随机初始化的，而是使用大量通用数据进行“预训练”，得到一套模型参数；

然后用这套参数对模型进行初始化，再利用少量特定领域的数据进行训练，这个过程即为“微调”。

预训练属于迁移学习的一种。预训练语言模型把自然语言处理带入了一个新的阶段——通过大数据预训练加小数据微调，自然语言处理任务的解决无须再依赖大量的人工调参。

GPT系列的模型结构秉承了不断堆叠Transformer的思想，将Transformer作为特征抽取器，使用超大的训练语料库、超多的模型参数以及超强的计算资源来进行训练，并通过不断提升训练语料的规模和质量，提升网络的参数数量，完成迭代更新。GPT模型的更新迭代也证明了，通过不断提升模型

ChatGPT的训练分为三个步骤。

第一步，通过人工标注的方式生成微调模型。标注团队首先准备一定数量的提示词样本，一部分由标注团队自行准备，另一部分来自OpenAI现有的数据积累。

然后，他们对这些样本进行了标注，其实就是人工对这些提示词输出了对应的答复，从而构成了“提示词—答复对”这样的数据集。最后用这些数据集来微调GPT-3.5，得到一个微调模型。

ChatGPT 模型训练步骤

第二步，训练一个可以评价答复满意度的奖励模型。同样准备一个提示词样本集，让第一步得到的模型来对其进行答复。对于每个提示词，要求模型输出多个答复。标注团队需要做的工作，就是将每个提示词的答复进行排序，这其中隐含了人类对模型输出效果的预期，以此形成了新的标注数据集，最终用来训练奖励模型。通过这个奖励模型，可以对模型的答复进行打分，也就为模型的答复提供了评价标准。

第三步，利用第二步训练好的奖励模型，通过强化学习算法来优化答复策略。这里采用的是一种策略优化模型，它会根据正在采取的行动和收到的奖励不断调整当前策略。具体来说，首先准备一个提示词样本集，对其中的提示词进行答复，然后利用第二步训练好的奖励模型去对该答复进行打分，根据打分结果调整答复策略。在此过程中，人工已经不再参与，而是利用“AI训练AI”的方式进行策略的更新。最终重复这个过程多次之后，就能得到一个答复质量更好的策略。

Diffusion 模型

促进AIGC领域快速发展的另一大功臣当然要数AI绘画技术的进步。尤其是2022年4月OpenAI发布的一款强大的AI绘画工具——DALL·E2。运用该工具，只需输入简短的文字，就可以生成全新的图像。

而它背后的技术核心就是——Diffusion模型。

生成对抗网络模型的缺点

在Diffusion模型出现之前，以GAN（生成对抗网络）模型为基础的图像生成模型还一直是研究的主流，但是GAN存在一些已知的缺陷。它可能不能学习完整的概率分布，比如用各种动物的图像训练GAN，它可能仅生成狗的图像；另外，还存在难训练等阻碍其广泛使用的一些技术问题。

Diffusion 模型的优点

而Diffusion模型利用最新的训练技术，跨越了GAN模型调优的阶段，可以直接用来做特定领域的任务，能实现令人震惊的生成效果，这也使得Diffusion模型领域的研究呈现出百花齐放的状态。

Diffusion 模型的本质与原理

Diffusion在中文中被译为“扩散”。扩散是一种物理学现象，指的是一种基于分子热运动的输运现象，是分子通过布朗运动从高浓度区域向低浓度区域转移的过程。它是趋向于热平衡态的过程，也是熵驱动的过程。

比如，

一滴墨水扩散到整个盛水的容器中。在这个扩散过程中，尝试计算容器的某个小体积内墨水分子的分布情况，是非常困难的，因为这种分布很复杂，也很难取样。但是，墨水最终会完全扩散到水中，这时候就可以直接用数学表达式来描述这种均匀且简单的分子概率分布。

统计热力学可以描述扩散过程中每一时刻的概率分布，而且每一时刻都是可逆的，只要步间距足够小，就可以从简单分布重新回到复杂分布。

Diffusion模型亦即扩散模型，最早是2015年在《基于非平衡热力学的深度无监督学习》(Deep Unsupervised Learning using Nonequilibrium Thermodynamics)论文中提出的。作者受统计热力学的启发，开发了一种新的生成模型。想法其实很简单：首先向训练数据集中的图像不断加入噪声，使之最终变成一张模糊的图像，这个过程就类似于向水中加入一滴墨水，墨水扩散，水变成淡蓝色，然后教模型学习如何逆转这一过程，将噪声转化为图像。

扩散模型的算法实现分为两个过程：正向扩散过程和逆向扩散过程。正向扩散过程可以描述为逐渐将高斯噪声应用于图像，直到图像变得完全无法识别。

比如通过正向扩散过程，图中的风景变得模糊起来，直到最后一整张图变成马赛克。这个过程看上去充满随机性，但实际上是存在特定意义的，整个过程可以表述为正向扩散过程的马尔可夫链——描述从一个状态到另一个状态的转换的随机过程。而这个随机过程中的每一个状态概率分布，只能由其前一个状态决定，与其他状态无关。对应地，我们可以把整个正向扩散过程的每一张图片定义为一个状态，那每一张图片是什么样子只跟它的上一张图片有关，并且遵循一定的概率分布。如此我们首先得到了一个定义明确的正向过程。

扩散模型的扩散过程

那如何应用这一过程将马赛克图像恢复到原始图像？其中的问题在于，从正向过程推导出明确的逆向过程是非常困难的。这一点根据实际情况也可以想象得到，一张多次加入随机噪声的非常模糊的图像，几乎是不可能完全恢复成原始图像的。

于是扩散模型采用的是一种近似的方式，即通过神经网络学习的方式近似计算逆向扩散过程的概率分布。

应用这种方法之后，即便是一张多次加入噪声后变得完全模糊的图像，也能被恢复成一张接近原始模样的图像，而且随着模型的迭代学习，最终生成的结果也将更符合要求。

通过正向扩散和逆向扩散两个过程，扩散模型就能实现以一张原始图像为基础，生成一张全新的图像。这大大降低了模型训练过程中数据处理的难度，相当于用一个新的数学范式，从另一个角度定义“生成”过程。和GAN模型相比，扩散模型只需要训练“生成器”，训练目标函数简单，而且不需要训练别的网络，实现了易用性的极大增强。

扩散模型在提出之初并没有受到很大的关注。

这一方面是因为当时GAN模型大行其道，研究人员的研究重心依然围绕在GAN基础上的优化；

另一方面是因为最开始的扩散模型生成的结果不是很理想，而且由于扩散过程是一个马尔可夫链，其缺点就是需要比较多的扩散步数才可以获得比较好的效果，这导致了样本生成很慢。

正如前述论文作者回忆时称的，“当时，这个模型并不令人惊喜”。

殊不知，更现代化的图像生成技术已悄悄萌芽，这一新的生成模型迸发出了令人意想不到的生命力，真正地登上了历史舞台，生成式图像应用也进入了“文本到图像”的摩登时代。

Stable Diffusion

Stable Diffusion是由Stability AI主导开发的文本生成图像模型，其交互简单，生成速度快，在极大地降低了使用门槛的同时还保持了令人惊讶的生成效果，从而掀起了另一股AI绘画的创作热潮。

Stable Diffusion的工作原理就是通过文本编码器将语义转化为计算机可以处理的语言，也就是将文本编码成计算机能理解的数学表示，之后将这些编码后的结果通过图像生成器转换为符合语义要求的图像。

首先来看文本编码器部分。计算机本身无法理解人类语言，需要使用一种文本编码的技术，即CLIP模型。CLIP模型是由OpenAI开源的深度学习领域的一个多模态模型。CLIP全称为contrastive language-image pre-training，即基于对比学习的大规模图文预训练模型。CLIP模型不仅有着语义理解的功能，还有将文本信息和图像信息结合，并通过注意力机制进行耦合的功能。CLIP模型在Stable Diffusion是怎么被训练并在文图转换中发挥作用的呢？

要训练一个能够处理人类语言并将其转化成计算机视觉语言的CLIP模型，必须先有一个结合人类语言和计算机视觉的数据集。实际上，CLIP模型就是在从网上收集到的4亿张图片和它们对应的文字描述基础上训练出来的。

CLIP模型由一个图像编码器和一个文本编码器构成。CLIP模型的训练过程如下图所示。首先从积累的数据集中随机抽取出一张图片和一段文字，在这里，文字和图片不一定是匹配的。抽取出的图片和文字会通过图像编码器和文本编码器被编码成两个向量。CLIP模型的任务就是确保图文匹配，并在此基础上进行训练，最终得到两个编码器各自最优的参数。

CLIP 训练图片及相关描述示例

CLIP 模型训练过程

比如一张狗的图片和“一只狗”的文字，训练好的CLIP模型就会将这两个内容通过图像编码器和文本编码器生成相似的编码结果，确保文字和图片是匹配的，这两者之间也就有了可以相互转化的基础。同时通过CLIP模型，人类语言和计算机视觉就有了统一的数学表示，这也就是文字生成图像的秘密所在。可以说，CLIP模型在Stable Diffusion的文本编码器部分发挥了最核心的作用。

图像生成器部分由两个阶段构成，一个是图像信息生成阶段，一个是图像解码阶段。

在图像信息生成阶段，扩散模型首先利用随机数生成函数生成一个随机噪声，之后与文本编码器部分利用CLIP模型生成的编码信息结合，生成一个包含噪声的语义编码信息。

然后这个语义编码信息又生成较低维度的图像信息，也就是所谓的隐空间信息(information of latent space)，代表着这个图像存在着隐变量。这也是Stable Diffusion较之前扩散模型在处理速度和资源利用上更胜一筹的原因。

一般的扩散模型在这个阶段都是直接生成图像，所以生成的信息更多，处理难度也更大。但是Stable Diffusion先生成隐变量，所以需要处理的信息更少，负荷也更小。

从技术上来说，Stable Diffusion是怎么做到的呢？其实是由一个深度学习分割网络(Unet)和一个调度算法共同完成的。调度算法控制生成的进度，Unet就具体去一步一步地执行生成的过程。在这个过程中，整个Unet的生成迭代过程要重复50~100次，隐变量的质量也在这个迭代的过程中变得更好。

图像信息生成之后就到了图像解码阶段。图像解码过程实际就是接过图像信息的隐变量，将其升维放大，还原成一张完整的图片。图像解码过程也是我们真正能获得一张图片的最终过程。由于扩散过程是一步一步迭代去噪的，每一步都向隐变量中注入语义信息，不断重复直到去噪完成。在图像解码过程中通过Unet的生成迭代，图片一步一步地成为我们想要的样子。

总结下就是：

Stable Diffusion首先通过CLIP模型对输入提示词进行语义理解，将其转换成与图像编码接近的编码信息，在后续模块看来，一段文字已经变成一张相似语义的图片了；然后在图像生成器模块中，完成完整的扩散、去噪、图像生成过程，生成一张符合提示词要求的图片。最终，通过文本编码器和图像生成器的共同作用，“字”变成“画”、“文字变图片”这种看似神奇的事就发生了。

AGI

近年来，人工智能解决方案在自然语言处理、视觉识别，文本、图片和视频生成等关键领域取得了令人难以置信的进步。而现在，人工智能正试图在匹配人类智能方面取得巨大飞跃，从只能适配特定领域的“弱人工智能”，向着更具通用性也可以说更强大的人工智能——AGI（artificial general intelligence，通用人工智能）前进。AGI无疑会成为下一个迅速发展的方向。

AGI也可称为“强人工智能”(strong AI)，指的是具备与人类同等智慧或超越人类智慧的人工智能，能表现出正常人类的所有智能行为。相较而言，我们现在和过去的所有人工智能都还属于“弱人工智能”或“窄人工智能”，虽然针对某一特定问题的解决能力可以很强，甚至超越人类，但很难解决其他问题。比如，我们教会机器识别人脸，但这一能力以及习得这一能力的过程和基本方法，对帮助它控制身体平衡和导航没什么帮助。

未来，人工智能若要达到AGI的水平，还需具备更加强大的能力，例如：存在不确定性因素时进行推理和制定决策的能力；知识表示的能力，包括常识性知识的表示能力；规划、学习以及使用自然语言进行沟通的能力；将上述能力整合起来实现既定目标的能力。

AGI将会是人工智能研究领域的下一个重要飞跃。

AGI 未来的研究方向

第一，跨模态感知。

我们将平时接触到的每一个信息来源域称为一个模态，这些来源可以是文字、声音、图像、味觉、触觉等等。

而当前绝大部分的人工智能系统只能单独运用其中的一项作为传感器来感知世界，对于不同的模态，需要设计不同的专有模型。

各种模型之间无法真正打通是走向AGI的一大痛点。因此，研究如何让人工智能系统实现跨模态感知非常关键。

第二，多任务协作。

人类能够同时处理多个任务，并在不同任务之间进行协调和转换。当人们面对机器人时，一句简单的吩咐，比如“请帮我热一下午餐”“请帮我把遥控器拿过来”等等，这些指令听上去简单，执行时却包含了理解指令、分解任务、规划路线、识别物体等一系列动作，针对每一个细分的动作都有专门的系统或者模型的设计。这就要求机器人有多任务协作的能力。因此，多任务协作是AGI最重要的研究方向之一。让“通用性”体现为不仅能够同时完成多种任务，还能够快速适应与其训练情况不同的新任务。

第三，自我学习和适应。

人类具有学习和适应能力，能够通过不断的学习和经验积累来提高自己的能力。因此，研究如何让人工智能系统具有自我学习和适应能力也是实现AGI的必要步骤。

其中主要包括增量学习、迁移学习和领域自适应三个方向。

增量学习就像人每天不断学习和接收新的知识，并且对已经学习到的知识不会遗忘，增量学习是指一个学习系统能不断地从新样本中学习新的知识，并能保存大部分以前已经学习到的知识，它解决的是深度学习中“灾难性遗忘”的问题。

迁移学习是人类的一种很常见的能力，例如，我们可能会发现学习识别苹果可能有助于识别梨，或者学习弹奏电子琴可能有助于学习弹钢琴。在机器学习中，我们可以把为任务A开发的模型作为初始点，重新使用在为任务B开发模型的过程中，即通过从已学习的相关任务中转移知识来改进学习的新任务。迁移学习的核心是找到并合理利用源领域和目标领域之间的相似性。

领域自适应可以看成迁移学习的一种，旨在利用源领域中标注好的数据，学习一个精确的模型，运用到无标注或只有少量标注的目标领域中。它要解决的核心问题是源领域和目标领域数据的联合概率分布不匹配。

第四，情感理解。

能够理解并表达情感是人类最重要的特征，它在交流协作中甚至常常影响事件的下一步走向。让人工智能系统理解情感，包括情感表达、情感分析和情感生成等，是实现AGI的一个关键方向。

第五，超级计算能力。

实现AGI需要庞大的计算资源和超级计算能力。

AIGC 的优势与瓶颈

优势

以ChatGPT为代表的AIGC应用目前已深度参与到企业的业务流程改造工作中，将文本、图片、视频、代码等内容的自动化生成能力，与原有的企业管理系统集成与融合，能够精简和优化原本复杂的业务流程，大幅提升组织的业务运行效率。

AIGC对业务流程的影响无疑是积极的，无论将AIGC用于内容撰写、智能客服、日程管理，还是用于市场营销、销售、财务、人力等业务领域，它都能够不同程度地精简或优化业务流程，缩短业务流程周期，提高业务流程效率，最终对企业和组织起到降本增效的作用。

瓶颈

1、内容准确率不高、可信性不强、文本直接拼凑、没有逻辑性等

2、AIGC的运行需要庞大的算力支持，技术的发展也加剧着对算力的需求，这势必产生巨大的成本，甚至需要探索计算方式的变革。

3、AIGC的发展和应用也可能会造成人员失业问题，取代部分蓝领和白领的工作，由此带来社会大范围的焦虑和恐慌。数据安全与隐私保护、著作权争议等问题也是AIGC进一步发展的瓶颈。

4、AIGC的生成能力来自数据和模型，而数据来源本身就会引起隐忧。AIGC的发展同样需要面对和解决数据问题（数据传输的安全、数据保护的安全等）。

你可能感兴趣的:(系统架构,人工智能,笔记,AIGC)

初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
2023-06-18 每天都微笑
20230618《会痛的不是爱》203笔记所有的自我破坏都隐藏了对更大牺牲的恐惧笔记1带着牺牲的付出，不是真的付出。这些牺牲里面，可能是我们的不配得感，讨好感，想要对方对自己有好的回应或是获得好的评价等等。这样的付出，其实是交换，是算计。而交换与算计，往往不是落空就是很难完全如愿，同时，很累很累。带着牺牲的付出，双方都无法真的受益。有的时候，有意识无意识的自我破坏，就是在暂停这样的局面，在表达，我
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
Valentino大衣怎么买便宜？Valentino华伦天奴2024秋季系列直返APP抖音优惠券
Valentino的这件大衣简直是时尚界的瑰宝！它完美地将经典与时尚融合在一起，剪裁精致，线条流畅，上身效果超赞。月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）通过直返APP买化妆用品（没有上级赚差价）购物，领券还能返佣！超级便宜~！分享赚钱，自用省钱！几款华伦天奴的大衣：VALENTINOCHAIN1967DOUBLECREPECOUTURE大衣：这款大衣
美嫺读书笔记美嫺
家长希望孩子快人一步，固有提前训练，欲揠苗助长。其实，从能力发展的过程来看，不必让孩子提前"预习"，顺其自然是最好的法则之一。人类有许多与生俱来的能力，每个年龄阶段自然就会掌握那个技能，就如走路一样。支配儿童心理发展的因素有两个:一个是成熟，另一个是学习。美国著名儿童心理学家格塞尔著名的——双胞胎爬梯实验表明:儿童的心理主要是一个自然成熟的过程，孩子的成长是受到生理和心理成熟机制制约的，教育并不能
业余时间干点什么副业？精选16个业余时间就能做的副业，建议收藏氧惠佣金真的高
许多小伙伴都在网上找副业或者兼职，但是不知道做什么好，今天小编我就来给大家介绍16个副业项目，看看是否适合你，我们往下看吧。一、信息差难度★1、月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可
DP学习笔记(8):完全背包求方案数，01背包求具体方案
完全背包求方案数常规分析在上一篇我们学习了01背包求方案数，今天我们学习完全背包求方案数。首先我们要区分一下01背包和完全背包的区别，01背包中的物品只有一个只有选或不选，完全背包中的物品有无限件实际有m/w[i]件，可以多选。我们在学习01背包求方案数时，要将j倒序来避免多选问题，在完全背包上我们需要多选，所以将j改为正序循环就可以满足我们的需求核心的状态和状态转移方程都是一样的状态:dp[j]
(新手友好)MySQL学习笔记(11):索引（前缀索引，聚簇索引，覆盖索引，最左前缀原则，索引设计原则，索引使用原则，索引失效的常见场景）李白洗一夜学习笔记
目录前缀索引聚簇索引覆盖索引（索引覆盖）最左前缀原则索引设计原则索引使用原则索引失效的常见场景前缀索引索引开头的部分字符，可以大大节约索引空间，提高索引效率。如TEXT数据类型必须使用前缀索引，因为MySQL不允许索引这些列的完整长度。InnoDB索引最大长度为767字节。最简单的理解就是在索引表中存储的不是索引字段的完整字段值，而是索引字段的前一部分字段值，比如：createindexIn_sn
DP学习笔记(7):有依赖背包，背包求方案数李白洗一夜学习笔记算法
有依赖背包常规分析有依赖背包特点:有主件，有附件，每种物品只有一件设主件的重量main_w[N]价值main_c[N],附件的重量sec_w[N][N],价值sec_c[N][N]那么01背包是不是可以看作特殊的有依赖背包，全是主件，没有附件的有依赖背包01背包的状态转移方程if(j>=w[i])dp[j]=max(dp[j],dp[j-w[i]]+c[i])是不是就可以看成只选主件的有依赖背包的
2024淘宝618口令红包大全(最新天猫淘宝618红包口令领取使用方法) 直返APP淘客项目
2024年淘宝618活动的红包口令是消费者们非常关注的一个方面，因为它们可以在购物时提供额外的优惠。以下是一些关于淘宝618红包口令的领取方法和使用指南：都在挣钱！推荐几个月入几千到几万的靠谱副业项目！返利就用直返APP，没有上级赚差价。粉丝亲切称呼：返利大王——直返app；「善士笔记」（shanshi2024）主理人+「直返」APP创始人曾白手起家，15个月赚到500W。互联网创业13年，目前月
C++入门教程笔记·基本语法数据类型
编写不易，请勿搬运嵌入式开发学C++有必要嘛首先嵌入式开发的常用工具，keil5，Vscode，Esp-idf三个编译工具中都是支持C++语言的，也就是说常见芯片种类ST、ESP、等芯片类型都能够使用C++进行开发，同时在公司工程中，对于使用C++开发的工程对于项目的后续维护，改版都是需要懂C++的，所以能看懂C++，学好C++非常有必要。同时在ST开发的hal库中的函数驱动底层抽象库中，都是使用
高建忠.读方用方笔记（一二七）临证谈小柴胡汤火帝养生
我们前面讨论了小柴胡汤治疗表证，现在来讨论小柴胡汤治疗里证，其实道理是一样的。在和解的基础上治疗表证，那么在和解的基础上治疗里证这也是一大法。李某，男，9岁。6月3日初诊。发热2天，下午及晚上较甚，呈持续性发热，纳食减少，不大便，有咽痛、口干，无恶寒，口不苦。舌质红，舌苔黄腻，脉弦数。这个九岁的孩子，发烧两天了，上午比较轻，下午和晚上比较重，吃饭也不怎么好，也不大便，口干，口不苦，有咽痛，也不恶寒
1.14读书笔记《义务教育英语课程标准（2022年版）解读》望亭陆曙良
第二阶段义务教育英语课程改革的主要问题有哪些？1.《课程标准（2011）》的课程目标与《高中课程标准（2017）》不一致。《课程标准（2011）》提出的英语课程总目标是培养学生的综合语言运用能力，《高中课程标准（2017）》提出的英语课程目标是培养学生的学科核心素养。2.部分教学理念与当前世界课程改革理念对接不够。在当前共建人类命运共同体的时代理念下，《课程标准（2011）》缺少前瞻性，学科育人价
骗子太猖獗了，打着摩根士丹利何晓斌名义带股民进入虚假宝丰能源节能减排碳交易市场，大量股民被骗真相曝光墨守成法
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！这些新平台打着“低风险”、“高收益”、“慈善公益投票”等噱头先让投资人尝到甜头再通过恶意操作将投资人
PyTorch笔记6----------神经网络案例 HuashuiMu花水木 PyTorch笔记 pytorch 笔记
1.回归网络波士顿房价预测模型搭建波士顿房价数据集下载链接：百度网盘请输入提取码提取码:5279导入所需包importtorchimportnumpyasnpimportre读取数据ff=open('housing.data').readlines()data=[]foriteminff:out=re.sub(r"\s{2,}","",item).strip()#通过正则表达式去除所有空格data
女儿的“提问” 枫的鸟儿
最近女儿情绪有些不稳定，也许是学业的压力，孩子选择听歌、运动去缓解自己的压力，我则是选择默默地支持她，陪伴她，发现孩子那个紧闭的门慢慢向我打开，有的时候会拿起书来问，“妈，你说这道题要怎么写呢？”我则是说女儿你看下书和笔记，陪同仔细地翻看她的书，笔记，有的时候真的是我也不懂，孩子靠自己解决完，“妈妈我好像明白一点了！”适时地夸奖：“女儿，你又靠自己的思考解决问题了，妈妈为你感到高兴！”原来孩子不像
阅读笔记‖不做无谓的争辩海风轻吹
《道德经》里讲：信言不美，美言不信；善者不辩，辩者不善。诸葛亮舌战群儒，一生经常与人辩论可谓雄辩之才，但是他却说：大辩不辩。辩论的最高境界，就是不辩！对待有些人，可能唯有沉默，才是最好的方法，沉默是金！庄子在《秋水》篇里讲过这样一句话：夏虫不可以语冰。就是说不要和夏天的虫子谈论冬天的冰，这纯属浪费时间。因为它从来没有感受过寒冬，它从来没有体验过冰雪，在它的世界里只有春天的阳光和炎炎夏日，它永远都无
《小狗钱钱2》读书笔记慧妍0010
文|慧妍图片发自App如果说《小狗钱钱》第一部侧重培养孩子的财商，那么第二部则侧重培养孩子的品格。《小狗钱钱2》提出了“甜甜圈理论”，即：甜甜圈外面的圈象征了金钱和一切可以消费的东西，而里面那个无形的圆孔就代表了人的内心，象征了我们无法看到却又必须具备的品格。没有金钱只有内心，生活都无法保证，幸福从何而来？只有金钱，失了内心的人，拥有的却不是真幸福。如何培养优秀的品格，书中给出了7条准则。每一条准
读书笔记06‖《时间管理，如何充分利用你的24小时》 Gemini_565d
54分钟，你没有听错，我读完了这本妙趣横生的书！总共128页，平均每分钟2页的阅读速度，我能行，你可以做到！作者用幽默诙谐的语言向我们讲述了时间管理的有效方法，字数不多，风格独特，没有废话！实际上并不单单指你24小时的内容！且来看看这本不占用你时间，但给你提出时间管理的技巧！01.主要结构与内容1.篇章结构上半部分:如何利用时间？下半部分:是否正在使用时间发挥最大效用？2.主要概念（1）意识是时间
2023-03-22 小郭不会打篮球
3.21笔记一、定位作用：显示定在所有其他元素之上、可以让元素在浏览器中任意位置。a标准流块级元素独占一行→垂直布局行内元素/行内块元素一行显示多个→水平布局b浮动可以让原本垂直布局的块级元素变成水平布局c定位可以让元素自由的摆放在网页的任意位置一般用于盒子之间的层叠情况1、属性名：position静态定位：static相对定位：relative绝对定位：absolute固定定位：fixed向下移
nextjs学习笔记 ainuo5213 web前端框架学习 next react react服务端渲染 next入门
由于本人最近在学习jocky老师的React16.8+Next.js+Koa2开发Github全栈项目关于react的服务端重构项目，然后跟着老师的视频做笔记，记录下自己的所学知识。目录结构pages(必需)：pages目录是nextjs中最终要的一个目录，这个目录的每一个文件都会对应到每一个页面，可以根据地址栏的路由进行跳转。若pages下的js文件在一个目录下，那么nextjs默认会将这个
读书笔记：德鲁克《管理的实践》17 李唐星辰
1、【企业对员工的要求】这个版块中提到：企业期望员工不只是被动接受劳动力工作，而必须主动承担达成经营绩效的责任。……要求越高，表现越好，是人的特性，因此员工能发挥多大的生产力，很大部分取决于企业对他们的要求有多高。星辰感悟：人的潜力是无限的。说这句话的时候，不仅肯定了自己，也肯定了所有奋斗的人。很多时候，认知会限制我们的想法。这跟小马过河是一个道理。松鼠小觉得小溪就是一条河，但是对于马儿来说根本不
Java程序设计笔记是程序蜂啊 java 笔记开发语言
Java程序设计目录Java程序设计第一章java语言开发环境1.1工具篇1.2Eclipse调整字体第三章Java基础3.1java基本数据类型3.2关键字与标识符3.3常数3.4变量3.5.数据类型转换3.6由键盘输入数据4.1顺序结构4.2分支语句5.1什么是数组5.2数组赋值：5.3一维数组5.4二维数组6.1类的基本概念6.2定义类6.3对象的创建与使用6.4参数的传递第七章java语言
《陪伴成长》读书笔记(一) 姬磨小学李会巧
今天，我读了《陪伴成长》中的“家庭教育不能盲从”这一章节，感受颇深。的确，在这个重视教育的年代，怎么样才能把自己的孩子教育成功呢？我们的孩子到底需要什么样的教育呢？当今社会，很多人都在渴望自己的孩子成为优秀，但他们很多人都忽视了优秀人才成长的基础；众多人都在关心孩子的教育，但他们很多人都把目光投向了分数；众多人都在以孩子成绩为荣，但他们很多人都淡忘了心理健康与道德修养；众多人都在给予爱，但他们很多
黑衣天使看见幸福开花
今日笔记：谁用脑谁受苦。半夜吃东西，因为我饿了，饿了就吃，困了就睡。不再带着担忧恐惧对孩子说：大半夜吃了东西，对肠胃不好啊。但我担忧恐惧半夜吃东西对孩子不好时，第一步要做的是格这个担忧恐惧，而不是欺骗自己说不担忧不恐惧，需要诚意的面对自己的情绪，再功课处理情绪。当我愤怒攻击对方，想让对方关注我，理解我的时候，我需要做的是看到自己的愤怒委屈，看着我的愤怒宝宝，委屈宝宝，而不是去想他为什么要如此针对我
计算机毕设——高校在线学习平台
随着教育信息化改革不断推进，传统教学模式逐渐暴露出诸多弊端，例如资源分散、互动匮乏、教学反馈滞后等。如何借助现代Web技术构建一个功能完善、稳定高效的教学平台，成为许多高校面临的重要课题。本文将从我的毕业设计项目《在线学习平台》出发，分享一个完整在线教育平台的设计与开发过程，涵盖技术选型、系统架构、核心模块实现以及系统测试等内容，适合对SpringBoot+Vue全栈开发感兴趣的同学学习参考。一、
智慧水库信息化系统建设产品需求文档V2.0 小赖同学啊 test Technology Precious 物联网
智慧水库信息化系统建设产品需求文档1.引言1.1文档目的本文档旨在明确智慧水库信息化系统的建设需求，为系统设计、开发和实施提供全面依据，确保系统功能满足水库管理业务需求，提升水库管理的智能化水平和决策效率。1.2背景介绍传统水库管理面临数据采集不及时、分析手段有限、决策依赖经验等问题，难以应对复杂多变的水文情势和日益增长的管理需求。随着物联网、大数据、人工智能等技术的发展，智慧水库建设成为必然趋势
从零开始学 Linux：循序渐进的学习指南我爱学嵌入式 Linux基础 linux 服务器
Linux作为一款开源、稳定且安全的操作系统，在服务器领域、嵌入式开发、云计算等场景中占据着举足轻重的地位。对于程序员、运维工程师或IT爱好者而言，掌握Linux技能已成为一项核心竞争力。但面对命令行界面和复杂的系统架构，很多初学者往往感到无从下手。本文将为你梳理一条清晰的Linux学习路径，助你从入门到精通。一、明确学习目标：为什么学Linux？学习Linux前需明确目标，不同目标对应不同的学习
Python学习笔记 cherishSpring python python 学习笔记
目录一、名词解释二、数据类型（变量名无类型，变量值有类型）三、数据类型转换(万物皆可转字符串)四、标识符五、运算符六、字符串扩展七、数据输入八、if语句九、while语句十、for循环语句十一、函数十二、数据容器1、List列表2、tuple元组3、字符串4、序列的常用操作-切片5、set集合6、dict字典7、数据容器相互转换8、通用操作十三、文件编码一、名词解释1、字面量被写在代码中的固定的值
黄仁勋链博会演讲实录：脱掉皮衣，穿上唐装，中文开场
黄仁勋一度尝试用中文开场，他说，“我在美国长大，学到了很多汉语。”他表示，像DeepSeek、阿里巴巴、MiniMax、百度，他们开发的产品都是世界级的，推动了全球人工智能的发展。中国的开源AI是全球进步的催化剂，以至于全世界各个行业都有机会加入到AI革命当中。7月16日，黄仁勋身着唐装出席了第三届链博会，在此之前，他身着标志性皮衣出席多个场合活动。在此之前，英伟达官宣获得H20芯片对华的出口许可
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

生成式人工智能笔记-AIGC笔记