csdn_csdn__AI

杨强教授漫谈《西部世界》、生成式对抗网络及迁移学习

近日，杨强教授在［范式大学］内部课程中，与大家分享了他在 “生成式对抗网络模型“ 和迁移学习等领域的独特见解和最新思考。在此特别感谢杨教授的博士生张颖华同学的帮助。以下内容根据杨强教授演讲编写，略微有所删减。
杨强教授是香港科技大学计算机与工程系主任，首位国际人工智能学会华人Fellow（AAAI Fellow）, 并为IEEE Fellow等多个国际学术协会的Fellow，ACM TIST和IEEE 大数据期刊创始主编，中国人工智能学会海外副理事长，国际人工智能协会(IJCAI) 常务理事，AAAI Executive Council member。曾任华为诺亚方舟实验室创始主任和2015年国际人工智能大会（IJCAI）程序主席。主要研究兴趣是人工智能和大数据，是迁移学习领域的开拓者。发表论文共计400余篇，引用超过两万次。
同时，杨强教授受邀担任CCAI 2017中国人工智能大会的大会主席，CCAI由中国人工智能学会发起、目前已成功举办两届，这也是中国国内级别最高、规模最大的人工智能大会。秉承前两届大会宗旨，由人工智能学会、蚂蚁金服主办，CSDN承办的第三届中国人工智能大会（CCAI 2017）将于7月22-23日在杭州召开。
本文由第四范式授权CSDN转载，特此感谢。

有些人看过电视剧《西部世界》—在《西部世界》里，你可能问的一个关键问题是什么？就是当剧中的人们，其中任何一个人走到你面前，你能否区分出他／她是个真人？你会问：咦，这不是图灵测试要解决的问题吗？是的。问题是，如果《西部世界》里的这些机器人已经通过了图灵测试，你又如何区分他／她们呢？

要解决这个问题，除了用“一枪把对方打死，然后看对方是否真的死了”这个极端的检测方法以外，还有什么更好的方法呢？这里有些剧透，答案是：拍苍蝇。当一个苍蝇飞到一个“人”的脸上，如果这个人没有感觉，不会去拨开或拍打苍蝇，他／她很可能就是机器人。结果因此还引发了一件趣事，去年美国大选的时候，希拉里在讲台上面，一个苍蝇飞到她脸上，她没有搭理，后来有人就说：糟了，我们要选一个机器人当总统了！那时《西部世界》恰好正在热播。

言归正传，从人工智能的角度，“拍苍蝇”这个例子，说明什么呢？它告诉我们有一些关键特征可供识别真人亦或机器人，但要找到这些关键特征并不容易。对《西部世界》而言，你得把整个剧看完才能知道。也就是说，你不但要有大量数据的训练，而且得知道剧里的机器人的制造原理，这样才能找到这个重要特征。那么问题来了：如果作为“游客”，我们对这个机器人的构造知道甚少怎么办？

要回答这一点，我首先要给大家讲一下概率模型的不同类型。概率模型是贯穿整个机器学习的主线。下面PPT上的这两张图是对一个女孩的素描，我们在素描里面可以看到很多的特征，比方说比较飘逸的笔画、或者是适合女性颜色等。我们把上面的问题简化一下：如何能够通过辨别这些体征、从而认出来画上的是男是女？

这里我要介绍一个“生成”模型的概念。在某个关于“人”的样本集里面找到某一个高概率的样本，我们认为这个样本很可能对应我们对“人” 这个概念的认识。然后我们根据这个样本来做完形填空或着彩。在小学中学我们经常做的一种题就是填空。其实，生成样本的过程和填空很相似：当我们看到这张画要给它着色时要选择颜色和图案，是因为这些选择符合“人”的概率分布。

再具体一些：如果数据是（X，Y），这里我们用X这个变量来代表笔画和颜色，Y这个变量来区分男女，那么这个概率数据是遵循一定分布规律的。但问题是，如何才能得到这个数据的分布？在现实中，做到这一点是非常难的，因为这需要我们获得概率的“联合分布”，就是所有显式和隐式的特征和它们所有可能取值的概率。知道了这个概率，生成某个样本就很容易了。在机器学习的历史上，关于要不要首先获得“联合分布”这个问题，有着很多的争论。比方说，有贝叶斯流派，就说：“是的，我们需要这样一个联合分布”。而深度学习流派，或者是SVM等算法对应的这些流派，就说：既然我们的目的是分类，那用简单的算法就可以了，所以”不需要”。得到一个联合概率分布是非常非常难的事情，因为需要因果关系的知识，还需要很多先验概率。

生成模型是很有用的。比如说，我们在一幅画上如何确定这样着色是有意义的，但那样做是没有意义的？除了在画作上，在音乐作曲的问题上也是如此：如何做一首动听的曲子？为什么有的曲子就很好听，有的就很难听？这些任务，其实都是在做“生成”的工作。我们为什么很尊敬某些作曲家、电影导演、作家？作为观众，我们去看电影很容易，但是让自己去做导演，做编剧往往就觉得很难。这是为什么呢？ “联合概率模型”的学习过程就帮助我们回答了这样一个问题。问题是：学习如何产生一个联合概率模型，需要大量的高质量数据来训练。真正能了解真实概率生成机制的只有少数人，即那些机器人的设计者。这也和我们的常识是一致的：只有少数人能够成为好的作家，只有少数人能够成为好的诗人，而要做到这一点需要遵循所谓的“一万个小时定律”。

因为生成式模型很难估计，所以，我们在机器学习中更多的是使用“判别式机器学习模型”的。这种模型和“生成式概率模型”是有一个本质的区别的。我们过去熟悉的模型如逻辑回归，SVM和深度学习等，多是判别式模型。就是：给你一个样本，模型不关注样本是怎么“真正”生成的，也不关心样本构造的真实因果关系和概率值，而是直接判别样本属于哪一类。 我们可以管这种判别的方式叫做“懒人主义”。相反，生成式模型可以被认为是一个“完美主义。” 什么是完美主义呢？我们要去判别一个事，从它最原始的那个点开始分析，产生先验概率分布，然后根据因果关系一直推到可观察的样本分布，最后再得到样本。这样，一旦得到整个联合概率分布，就可以对缺失数据和未来的事件做出准确的预测。所以，到了完成了这个联合分布的学习时，我们机器学习的工作就做的差不多了。

生成式模型和判别式模型的区别很像人和机器的区别：机器采取的是完美主义，因为它可以不断优化，追求极致。而人不会如此，人是够好了就满足了。从这一点上来说，人完全没有必要和阿尔法狗去比赛，因为这是不明智的。我们人类的构造不是干这个的，我们的构造是能把一件事给做完了。比方说，人应该去比的是你有多快能学会下围棋，并从中得到多少乐趣。而把围棋下的极致这件事是机器擅长的。

有没有办法，利用有限的数据，通过不断提高的方式，建立一个生成式模型呢？ Ian Goodfellow提出了一种新的方法，很值得我们思考：他的设想是用一个生成式模型（Generator）来生成模拟样本，再用一个判别式模型来区分这个生成的样本是否真实，这样的一对系统，可以互相对弈，共同提高。以作画为例。假设我们的目的是设计一台机器人来模拟大师们的画作。最开始，机器人先通过生成式模型完成某个画作。这幅画可能很差，离大师的水平差的很远。如果这个时候有一个评论员（判别式模型）来告诉机器人这幅画的缺点，那机器人就可以在下一幅画中加以提高。如果评论员自己犯了错误，没认对，那机器人就可以告诉评论员如何提高鉴赏能力。评论员总是在问这样一个问题：这幅画是大师画的还是机器人画的？如果判别式模型可以准确地辨认出来是机器画的，那说明这个生成式模型还不够好，如果判别不出来，就说明画作已经能够以假乱真了，而判别式模型就有待提高。这里，生成式模型和判别式模型，利用不断反馈，实现相互提高。

这让我们想起了图灵测试——计算机和裁判聊天，他们互相看不到彼此，如果在沟通的时候，裁判无法辨别哪个是计算机，“人工智能”在它身上就实现了。这个双机结构和图灵测试不同的地方就是，机器和判官都可以学习，不断提高，最后两者都可以达到最好。

这样，就把我们带到“生成式对抗网络” （GenerativeAdverserial Network, 或者GAN）这个概念。如下图所示，我们有两个系统，在互相对抗，两个系统都试图优化自己的目标函数。第一个系统对应判别式模型D：判别式模型D在试图识别到来的样本是否是自然真实的；它在尽量增大对真实样本的识别率，同时减少对模拟生成的样本的误判率。另一个系统则对应着生成式模型G：G希望它生成的模拟样本可以在D那里鱼目混珠。所以G试图最大可能地模拟真实的样本。判别器D从判别角度来说，判别的越好，D的目标实现的就越优。但对于生成器G来说，它要最小化（minimize）对方的优化函数，这就相当于最大化（maximize）它自己的优化函数。这个过程就像G和D在下棋一样（如下图的博弈树）。在这个树里有两个棋手，一个在不断更新判别器，一个是在不断更新生成器。把这两个合并起来，叫做Minimax算法，这是利用AI下棋的一个基本算法。在这里，就是G和D两个系统在竞争中不断成长，最后两个都达到最优。

这个交互过程到底能不能同时优化两个目标？GAN的发明人Goodfellow有以下的解释。训练过程如下图所示，假设黑色的点是真实样本的分布，绿色的线是根据生成模型产生的生成的样本的分布，那么GAN网络就是在把生成的样本的概率空间映射到真实样本空间里，再去加以对比。这样得到的结果与真实情况会存在偏差，而根据这样的反馈，生成的样本的数据分布不断得到调整，直到和真实分布重合为止。这时，判别式模型G就分不出来真假数据，而学习任务就完成了。

那么，有没有理论来证明以上这个博弈学习交互过程会最终得到令人满意的结果呢？我们看看下面这个定理：

这里给大家翻译一下这个公式：

如果G是丈夫，D是妻子，妻子训练丈夫做家务。妻子不断指出丈夫的不足之处，以此希望丈夫提高自己。丈夫呢，有时他提高的办法是试图猜出妻子满意的家务到底是什么，就不断的试验。但一开始结果可能和妻子的需求不一样，然后得到一顿狠K。所以在提高如果夫妻两人同样好学，妻子能不断指出丈夫的错误，而丈夫也不放弃，一直很努力，那么这对夫妻就会一起进步，一直达到一个共同的最优值，这个家庭也就美满了。

那么这个定理到底是不是靠谱呢？因为它有很多的限制条件，这些条件在现实中都很难成立，所以我们只能通过实验来验证。比方说，我们可以使用手写识别的数据集MNIST和图像识别的数据集TFD来验证，最后发现GAN在集种不同的算法里面的得分是最高的！

利用GAN也可以让电脑学写字。在训练好的时候，这些GAN写的文字几乎可以以假乱真。但它也有做不好的地方，比如说在一些复杂的图像中做出来的就是相当模糊的。我们后面会讨论，这是因为GAN在数据集之间的“距离”的概念还没有学好。

我们接下来要问：样本到底是怎么产生的？一个简单的办法是“猜测”：我们首先可以假设一个真实的概率分布是按照某种形式来分布的，然后按照这种形式随机地产生一个样本。这样的结果如果不好，那就回来修改这个分布假设。但是，这种猜的办法质量低，速度慢，结果不靠谱。

那要怎么办呢？假设我们有一张很大的画，我们要把它压缩一张小画，一般是怎么做的呢？我们大家可能用过双筒望远镜。这个望远镜可以反着看，就会看到小版的画面，这个就相当于把一大块数字压缩成一个数字，这个过程叫做convolution（卷积），卷积神经网络就是在做这件事情。那如果我们正着看望远镜，会把一张画放大，我们会看到画作当中的某一个部分，这个过程就相当于从一个或几个数字产生了整个矩阵，这也就是“生成”的过程，即生成式模型在做的事情。理解了这个原理后，基于深度学习和卷积，我们把整个网络反过来，相当于正着用望远镜，把压缩的图形一步一步放大，最后形成了一个复原的样本，它叫“转置卷积（Transposed-Convolution）”，这个产生样本的方法叫做DCGAN。比方说，可以通过几个例子的训练之后，用来产生新的中文字。还有一些漫画的社区也开始用这个网络，来自动生成漫画的图像。

当然，还可以用DCGAN网络来分类，用它的判别式模型部分来做分类这件事。这就好像用大炮打蚊子是没有必要的，但用大炮里某个部件（即判别式模型）打蚊子，确实要比用大炮拍打蚊子要打的好。所以，我们取出一块深度网络中的一部分来分析，发现它确实可以帮助找到非常关键的一些数据特征，而且用它来做分类的效果就比其他的办法要好很多。再回到西部世界的那个例子，看“苍蝇趴在脸上，人的反应”这个特征，就可以被找出来了。

有了GAN这个方法，我们可以对任意样本做向量化，从而加以比较。比方说，我们可以比较“苹果”和“橘子”，看它们的距离到底是不是比“苹果”和“香蕉”近一些？我们知道在自然语言界有一个技术叫Word2vec，从文字到向量表示（Embedding），是一个连续实数向量。它可以做什么呢？比方说它认为，v(“woman”)-v(“man”)+v(“king”) =v(“queen”)，即女人减去男人，再加上一个国王，相当于把女人的特性赋予国王，这个国王对应的就应该是女王，这个过程做类比。类比是怎么产生的呢？在高维空间，大数据会表明，这两个字的用法差不多，它们的距离很近。而GAN网络也可以做这件事情，比方说这个男的戴墨镜，减去一个男的再加一个女的，就变成了一个女的戴墨镜，这个是可以用GAN可以做的，很神奇。

但是这样设计的系统还是有一些缺点。比如，如果我们稍微换一换模型的参数，模型效果就会急剧变差。这说明，直接用DCGAN建立的模型不大可靠。

怎么解决这个问题呢？我们在开始讲过，GAN的思想就是不断修改生成式模型使得模拟的概率模型尽量接近实际的概率模型。所以，可靠性问题的实质就在于：如何可靠准确地测量两个概率分布之间的距离。这里有一个新的技术叫Wasserstein GAN。因为传统的生成式模型的目标函数通常都是优化KLdivergence, GAN的目标函数在优化JS divergence. 但这两个距离都有缺点：就是不能准确表达所有分布之间的距离。所以有人提出一个更靠谱距离表达，叫做Wasserstein距离，外号叫“土地挖掘机” （Earth-mover），就是给你一个土山，那么如果你用挖掘机在这一座山，去复制另一座山，问你需要花多大的力气 — 这个移动土地的费用就是Wasserstein 距离，简称W距离。如果两座山的形状完全一样，那么就不需要任何费用。如果两者完全不同，那么就需要很多的费用。

如果换成这个W距离来测量概率分布就好得多。比如说，给定两个数据集的分布，其中一个是真实的新闻分布，一个是假新闻的分布。如果用KL或JS距离来表达，结果都不够好，会得到一个是无穷大，一个是一个常数。用这样的距离就没有办法识别真、假新闻了。但如果我们用了W距离，得到的会是一个连续可导的距离。所以，用W距离来设计GAN （WGAN）就靠谱多了。

生成式对抗模型（GAN）可以做哪些事呢？它可以做模型的解释，做图像分析和自然语言分析。还可以再加上一些新的边界条件，用来做迁移学习。

上面这个例子，是把一个模糊影像变到清晰影像的任务，模糊影像的模型是有很多的不确定的地方。把一幅画变为清晰的过程，就是在一个矩阵里面找到丢失的值，并且把它用真实值填满；这个事和我们第四范式做推荐系统的概念是一样的。

再者，就是可以用GAN来很自然地实现迁移学习。比如说，如果我们又一个很好的生成式模型，在某个数据集上已经训练好了，如果有一些新的数据，和前一个数据集有明显的区别，那么我们可以利用“GAN＋边界条件”，把生成式模型“迁移到” 新的数据分布上。比方说，我们写字的时候，每个人签名都是不同的，我们不会用印刷体来签名，因为我们每个人都有自己的写字的特点。那么，如果用大量的印刷体字作为第一部分的训练样本，来训练一个不错的通用模型，而用某个人手写的斜体字做第二部分的训练样本，就可以利用WGAN**把印刷体的模型迁移到个人的签名。也就是说，这样的签名也就更具个性化特点**。

所以说，即使源数据和目标数据在写法上、颜色上有一些区别，GAN的模型可以实现迁移学习的目标。

这里还有一个迁移学习的例子：在领域适应（Domain Adaptation）的问题中，在目标领域没有任何的标注，所有的标注都在源领域。 GANIN等人设计了一个类似于GAN的模型，在源领域用标注数据来做标注数据的分类，同时连接到一个“领域判别器”来区分输入的数据，看数据是来源还是目标领域。这个过程进行到最后，当领域判别器不可以很好地区分数据来自哪个领域，就说明神经网络的中间层学会两个不同领域的相同特征部分了。这个时候，迁移学习的目的就达到了。

总结起来我们看到，生成式对抗网络是一个新的机器学习的思想。它是由两个模型共同产生的——就像是两个学生同时成长，一个学生专注于生成样本，一个学生专注于判别真假，他们来互相促进。同时，生成式对抗网络也存在一定缺陷，首先它需要的数据量还是很大的；此外，理论的指导还是比较缺乏。

最后我们还回到《西部世界》的场景。这个电视剧的一条主线是对机器人（或人类）的智能成长的路径，电视剧的后面几集提出了一个重要的思想：“二分心智”（Bicameral Mind）。这是个关于人类智能的发展的假说：提出大脑中的智能和意识的发展，是通过两个独立的智能体的不断对话和学习来实现的。也就是我们常说的 “脑袋里的两个小人在打架”。这个二份心智理论曾经在心理学界大行其道。

我们看到，生成式对抗网络GAN的模型，和这个“二分心智”的理论有些不谋而合：它们都是认为智能应该是能够不断学习提高的，都提出：智能成长的机制是由两个互动的系统来相互刺激。在GAN这个模型中，这两个机制分别是生成式模型和判别式模型。在《西部世界》里，这个刺激来自很多的苦难和创痛，让机器人Dolores 和她的同伴们经历了很多痛苦艰难的事情，最后刺激让她／他们产生了“二分心智”，也就产生了意识。就像这幅图中的两个Dolores在对话所表现的那样，最终导致机器人们产生了意识。

当然，在生成式对抗网络GAN的学术方向上，并没有涉及到“意识的生成”这个问题，实际上，整个人工智能的发展都还没有涉及到“意识”的概念。但是，通过GAN来理解的“二分心智”，以及“我们可以借两个对抗系统提高智能”这件事，还是非常有趣的！

扩展阅读：
[1] Goodfellow, Ian, et al. “Generative adversarial nets.” Advances in neural information processing systems. 2014.
[2] Ganin, Yaroslav, et al. “Domain-adversarial training of neural networks.” Journal of Machine Learning Research 17.59 (2016): 1-35.

JAVA代码实现ElasticSearch搜索（入门-进阶）(一):搜索方法、多字段查询、高亮展示 majunssz elasticsearch elasticsearch
一、搜索方法对比首先存入一条数据count="ilikeeatingandkuing"默认分词器应该将内容分为“i”“like”“eating”“and”“kuing”1.QueryBuilders.matchQuery("count",count);会将搜索词分词，再与目标查询字段进行匹配，若分词中的任意一个词与目标字段匹配上，则可查询到。count="i"可查出count="ili"可查出co
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
MySQL 8.0新特性深度解析：窗口函数与JSON数据处理的10大技巧墨瑾轩一起学学数据库【一】mysql json
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第1章：MySQL8.0简介嗨，亲爱的小伙伴们！欢迎来到MySQL8.0的奇妙世界，这里充满了新鲜和惊喜。MySQL8.0是一个数据库界的超级英雄，它带着一系列令人兴奋的新特性，比如窗口函数和JSON数据处理，来拯救我们的数据处理任务。1.1MySQL8.0的
揭秘Java内存模型：那些让人头疼的可见性问题--JVM基础(15) guangzhi0633 java jvm 开发语言
一、揭秘Java内存模型：那些让人头疼的可见性问题在Java的世界里，多线程编程如同一场精彩的魔术表演，但稍有不慎，就可能陷入“内存可见性”这个魔术黑洞。今天，就让我们一起揭开Java内存模型的神秘面纱，探讨那些让人头疼的可见性问题！可见性问题的本质可见性问题，简单来说，就是当一个线程修改了共享变量的值后，其他线程却无法立即看到这个变化。这就像是你在房间里悄悄换了件衣服，但别人却看不到你的新装。现
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
掌握ChatGPT写代码的秘诀：开发者的完整指南酷酷的崽798 机器学习 chatgpt
文章目录前言：如何利用ChatGPT来写代码：一个深度指南1.ChatGPT的基本功能概述2.利用ChatGPT辅助代码编写的好处3.ChatGPT支持的编程语言4.如何向ChatGPT提问以获取最佳结果5.实际应用案例6.ChatGPT的局限性及其解决方法7.关于隐私和安全性的注意事项8.未来展望结论前言：如何利用ChatGPT来写代码：一个深度指南近年来，人工智能技术取得了飞跃性的进展，尤其是
我的编程学习之旅 Stars·ꦿ໊ོ 学习
大家好，我是一名编程领域的初学者，怀揣着对代码世界的无限热忱，踏上了这充满挑战与惊喜的学习之路。我并非本科出身，在过往的学习，逐渐被编程的魅力所吸引。日常里，我喜欢拆解电子产品、探究其原理，这份好奇心也驱使我深入代码的海洋，期望能从软件层面创造更多“奇迹”。如今，我选择从C语言开始敲开编程世界的大门，它作为一门基础且强大的编程语言，有着广泛的应用场景，无论是底层系统开发、嵌入式编程，还是对理解计算
蓝桥大使【算法赛】----贪心算法 wyshh119 算法学习贪心算法
这里比较的难点在于sort排序的根据是什么，为什么是两人的报酬差，我的理解是当两人报酬差越大，那么总报酬的损失就越大，其实是缺少具体的证明的，但是通过就说明确实是这样。也就不深究证明了。#include#includeusingnamespacestd;longlongans=0;constintN=100005;structnode{//结构体inta;intb;};nodea[N];intma
Shell 脚本：自动化运维的利器 Waitccy linux 服务器运维
Shell脚本：自动化运维的利器一、引言在计算机的世界里，效率就是一切。当我们需要频繁执行一系列命令时，手动输入不仅繁琐，还容易出错。Shell脚本就是为解决这类问题而生的强大工具。它允许用户将一系列的命令组合在一起，形成一个可执行的脚本文件，从而实现自动化任务，提高工作效率。无论是系统管理员进行服务器维护，还是开发者进行项目部署，Shell脚本都发挥着重要的作用。本文将详细介绍Shell脚本的基
如何用Function Calling解锁OpenAI的「真实世界」交互能力？（附Node.js 实战） hongkid AI编程
一、FunctionCalling：大模型的「手脚延伸器」1.1核心定义FunctionCalling是OpenAI在2023年6月13日推出的革命性功能（对应模型版本gpt-3.5-turbo-0613和gpt-4-0613），允许开发者通过自然语言指令触发预定义函数，实现大模型与现实世界系统的交互。如同给语言模型安装「手脚」，使其不仅能思考，还能执行具体操作。openai官方说明：https:
位图思想详解：用一个小小的比特征服整个世界 Joseit 优选算法 java 算法
位图思想详解：用一个小小的比特征服整个世界一、什么是位图？二、位图的形象理解三、位图的Java实现四、位图的算法原理剖析五、实际应用案例：网站用户活跃度统计五、真实的应用场景：布隆过滤器的基础六、算法题：判断字符是否唯一（easy）一、什么是位图？位图是一种超级节省空间的数据结构，他利用二进制位（0/1）来表示某个元素是否存在或某种状态是否为真。想象一下，用一个小小的比特位就能记录一个信息，这简直
线性代数-MIT 18.06-汇总儒雅的钓翁数学基础线性代数矩阵
第一讲：方程组的几何解释第二讲：矩阵消元第三讲：乘法和逆矩阵第四讲：AAA的LULULU分解第五讲：转换、置换、向量空间R第六讲：列空间和零空间第七讲：求解Ax=0Ax=0Ax=0，主变量，特解第八讲：求解Ax=bAx=bAx=b：可解性和解的结构第九讲：线性相关性、基、维数第十讲四个基本子空间第十一讲：矩阵空间、秩1矩阵和小世界图第十二讲：图和网络第十三讲：复习一第十四讲：正交向量与子空间第十五
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
探索ELF世界的大门：JElf库深度揭秘班歆韦Divine
探索ELF世界的大门：JElf库深度揭秘jelfELFparsinglibraryinjava.项目地址:https://gitcode.com/gh_mirrors/je/jelf在软件工程的浩瀚星空中，有一种文件格式如星辰般不可或缺，它便是ExecutableandLinkableFormat（ELF）——一个为Linux和Unix系统而生的传奇。今天，我们荣幸地向您介绍一款专为此格式设计的J
新书速览|云原生Kubernetes自动化运维实践全栈开发圈云原生运维 kubernetes
《云原生Kubernetes自动化运维实践》本书内容：《云原生Kubernetes自动化运维实践》以一名大型企业集群运维工程师的实战经验为基础，全面系统地阐述Kubernetes（K8s）在自动化运维领域的技术应用。《云原生Kubernetes自动化运维实践》共16章，内容由浅入深，逐步揭示K8s的原理及实际操作技巧。第1章引领读者踏入Kubernetes的世界，详细介绍其起源、核心组件的概念以及
深入探讨盘古大模型的高精度多尺度能力 Hardess-god WRF 人工智能算法
随着人工智能技术的快速发展，大模型的研究逐渐进入新的阶段。其中，盘古大模型以其卓越的高精度和多尺度处理能力成为研究热点。本文将详细分析盘古模型在高精度多尺度问题上的技术特征、优势和应用潜力，并探讨其深入研究的方向。一、盘古模型概述盘古模型是华为推出的中文预训练大模型系列，拥有数十亿甚至千亿级的参数规模。它以Transformer架构为基础，通过海量文本数据进行训练，表现出优异的自然语言理解和生成能
AI巨浪中的安全之舵：天空卫士助力人工智能落地远航天空卫士人工智能安全数据安全网络安全大数据
"AI时代的安全战场，不在云端在本地；数据治理的胜负手，不在防御在认知。"近期，众多企业纷纷接入DeepSeek大模型，迅速推动了大型模型应用的广泛铺开。无论是在制造业、金融业，还是在医疗、教育等领域，DeepSeek大模型的应用都如火如荼，遍地开花，展现出了其广泛的应用前景和巨大的商业价值。顺势而来的是DeepSeek一体机以"低成本、高算力、私有化部署"的优势席卷企业市场。因为DeepSeek
DeepSeek重塑软件行业：研发工程师的机遇与挑战 LiuSid7 人工智能 llama 语言模型 ai
人工智能技术的浪潮正以前所未有的速度重塑软件行业，而DeepSeek作为其中的代表性技术，已成为研发工程师日常工作中不可忽视的变革力量。从代码生成到架构优化，从效率提升到职业生态重构，DeepSeek正在重新定义工程师的工作范式。以下从技术革新、职业发展、行业趋势三个维度，分析其对研发工程师的核心影响。一、技术革新：从“重复劳动”到“创造力释放”代码生产的效率革命DeepSeek通过自然语言指令生
WebGL开发：BabylonJS从入门到精通（下卷）莲华君前端权威教程合集 WebGL系统化学习 webgl
全书卷目：WebGL开发：BabylonJS从入门到精通（上卷）WebGL开发：BabylonJS从入门到精通（下卷）目录第一部分：基础篇——构建3D世界的基石第一章：BabylonJS概述与环境搭建什么是BabylonJS：WebGL宇宙的创世引擎BabylonJS的历史与优势：开源利剑的进化史安装与配置开发环境：3D工匠的工坊搭建术使用BabylonJSPlayground与本地开发环境浏览器
机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现 Hardess-god WRF 算法人工智能
随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南 m0_57781768 python langchain 搜索引擎
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南引言在人工智能和自然语言处理领域，利用大语言模型（LLM）构建复杂的问答（Q&A）系统是一个重要应用。检索增强生成（RetrievalAugmentedGeneration，RAG）是一种技术，通过将模型知识与额外数据结合来增强LLM的能力，使其能够回答关于特定源信息的问题。这些应用不仅限于公开数据，还可以处理私有数据和模
不用再当“技术宅“！这个AI神器让我5分钟变身人工智能达人阳光永恒736 AI工具人工智能 deepseek 一键包本地部署 AI资源
最近我在朋友圈刷到好多朋友都在玩AI画图、AI写诗，看得我心痒痒。可每次想自己试试，打开教程就被满屏的代码吓退——"Python环境配置"、"CUDA驱动安装"这些词比数学作业还让人头疼。直到我发现了一个叫DeepSeek本地部署一键包的神器，我的AI探索之旅终于变得像搭乐高一样简单！夸克网盘分享一、原来AI离我们这么近上周三放学路上，我看见隔壁班的小美用AI给自己照片生成古风造型，这让我突然意识
DeepSeek API在AutoCAD中的创新应用与挑战 CodeJourney. 数据库算法人工智能
在数字化设计领域，随着人工智能技术的飞速发展，将AI能力融入传统设计软件成为提升设计效率和质量的重要趋势。AutoCAD作为广泛应用的计算机辅助设计软件，与DeepSeekAPI的结合展现出了巨大的潜力。这种融合不仅为设计工作带来了全新的思路和方法，还在多个方面对设计流程进行了优化和创新。一、DeepSeekAPI赋能AutoCAD的多元应用场景（一）智能设计辅助：让创意快速落地在传统设计过程中，
AI 赋能应急管理：ChatGPT、DeepSeek、Grok 的应用探索一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能（AI）技术的快速发展，大语言模型（LLM）在应急管理领域的应用逐步扩大。ChatGPT、DeepSeek、Grok等AI模型凭借强大的文本处理、数据分析和推理能力，可为灾害预警、应急响应、风险评估等提供高效支持。本文将对比三大AI模型在应急管理中的优势，并探讨其在未来智能化应急管理体系中的应用前景。2.应急管理中的核心挑战应
DeepSeek的崛起：2025新春国产AI模型的全球影响力耶耶Norsea 网络杂烩人工智能百度
摘要在2025年新春之际，国产AI模型DeepSeek以现象级的姿态迅速崛起，凭借免费、易用及高性能的特点，吸引了全球科技界的广泛关注。这款大型人工智能模型不仅展现了国产技术的实力，还为用户提供了高效便捷的使用体验，成为行业内的焦点。关键词DeepSeek崛起,2025新春,国产AI模型,免费易用,高性能特点一、国产AI的崭新篇章1.1DeepSeek的诞生背景在2025年新春之际，DeepSee
一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！小城哇哇人工智能语言模型 AI大模型大模型微调预训练 agi LLM
前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。近年来，人工智能（AI）在各个领域的突破性进展，尤其是在自然语言处理（NLP）方面，引起了广泛关注。两项重要的技术方法——预训练和微调，成为了AI模型发展的基石。预训练通常是指在大规模数据集上进行模型训练，以帮助
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

杨强教授漫谈《西部世界》、生成式对抗网络及迁移学习

你可能感兴趣的:(GAN,迁移学习,西部世界,人工智能)