最近正好有这样的机会,让我给一群非技术人士介绍生成式AI,忙忙碌碌了一阵子,结果发现受众还是未能理解什么是生成式AI,到底和之前的AI有什么区别。因此希望此篇能够帮助普通人真正理解生成式AI,有个直观印象。
首先,说说AI,Artificial Intelligence是“人工智能”的英文两首字母的缩写,它意味着用计算机去帮助人们完成一些类似人类才能完成的一些工作,比如识别物品,识别花草树木,根据历史的天气情况预测明天的天气等等,总之是让机器像人一样去辅助人类去完成某项任务。
它经历几十年的发展,有高潮有低谷,至今仍然在蓬勃发展,可以参见下图它的一个发展历程:
对一项技术而言,其实还挺不简单的,为什么这样说呢?从事计算机工作20余年,经历了太多的技术从产生到发展直至无人问津,因为社会在发展进步,人们的需求在不断向更高层转变,劳动工具在更新,技术也在不断发展。 一些古老的技术已经逐渐退出历史舞台,然而AI这项技术经历了这么多年的洗礼,有高峰有低谷,依然吸引着大家,说明在技术发展的历史浪潮中确实有其存在的价值和意义。
回到正题,那我说说这波最新的浪潮生成式AI到底是什么?简单来说,生成式AI是通过学习现有的数据来生成新的内容(包括文本生成,图片生成,音视频生成,3D生成等),从而实现类似人类创造力的功能。
什么是文本生成?比如说,让生成式AI根据你列的大纲标题写一篇通讯稿。图片生成:根据你写的一段文字描述来生成艺术照片。音视频、3D生成等也都是类似的概念。这里的”新“,指的是组合了模型学来的各种资料,生成出的结果看似”新“,其实有时候也是个”缝合怪“,不经意会出一些意想不到的结果,令人啼笑皆非。
我想从概念上用两个成语来形容生成式AI和非生成式AI:“无中生有”和“各显神通”。
这里的”无“并不是空无虚无,而是很多时候由一些随机种子、随机数来初始化驱动生成,所以它生成出来的结果很多时候会伴随着一些不确定性;
而传统的非生成式AI,会面向各个特定的具体任务去努力将各自任务做到最好,比如人脸识别,语音识别,商品分类...每一个单一的任务都有具体的AI模型去承担相应的工作。
那生成式AI是2022或2023年才有的概念吗?答案是否定的。
在前一波AI的浪潮里,像GAN(生成对抗网络),VAE等技术就已经是做生成类的各项工作了,只不过随着算力提升,大模型技术的发展,才有了这波生成式AI的技术热潮。记得我第一次接触GAN在2017年初,那时用GAN生成一个卡通人物肖像在普通笔记本上跑一晚上也就生成出了几张图片,现在用Diffusion模型只需几秒。
有时,人们会聊到生成式模型和判别式模型。其实这和前面说的生成式AI和非生成式AI根本不是一个概念。判别式模型和生成式模型是机器学习中有监督学习对模型的两种分类,简单地说,判别式模型是针对条件分布建模,而生成式模型则针对概率联合分布进行建模。通俗的讲:判别式模型是直接求P(y|x), 而生成式模型先计算了联合概率P(x,y),再由贝叶斯公式计算得到条件概率P(y|x)。虽然它们最终的判断依据都是条件概率P(y|x), 但生成式模型可以体现更多数据本身的分布信息,其普适性更广。
从下图我们了解到,判别式模型是在寻找一个决策边界,通过该边界来将样本划分到对应类别。而生成式模型则不同,它学习了每个类别的边界,它包含了更多信息,可以用来生成样本。
这里简单总结一下生成式AI和传统AI的区别
二者是相辅相成的关系。简单来说,有了生成式AI的加持,传统的任务AI可以做得更好,更高效,是“1+1>2" 的效果提升,而不是非此即彼的关系。
拿医疗影像AI病理分析来说,之前的做法是,通过AI影像分析模型分析到病灶的位置,预测可能的病情,再经由医生判断,给出诊断结论,录入系统生成病理报告。 生成式AI的做法是直接读取影像生成出病理报告,当然这里需要医生把把关,对一些关键的信息,结论措辞调整。同时,患者可以直接和病理报告进行交流,了解一些专业结论所表明的具体含义。
再例如,以前的游戏人物设计,需要美工人员可能会从0开始设计人物原型,现在的生成式AI可以根据你的描述词生成出大量的人物原稿供你选择,同时可以给你自动上色,美工要做的是后期的精修和调整,这大大提升了产出效率。
以前的虚拟数字人提供的傻瓜式的问答服务,你多问他一些未事先储备定义好的问题,他就无法回答你或者回答得比较差。现在有了生成式AI大语言模型的支持,可以支持很多轮的对话,同时会有千人千面特点,极具个性和拟人化色彩,让你感觉是和真人在交流。
再比如,以前的考试评判AI系统可能只给出个评判结果,现如今通过生成式AI不仅可以得到评判结果,还能知道哪个推理步骤错了,辅导学生去改正解题步骤中的错误。同时启发学生不同的解题思路和解题方法,一步一步引导学生做出最终结果。
最后,简单总结一下,生成式AI的优势是提供创意性的,合成的一类结果,它可以大大提升某些种类工作的效率,但目前来看并不具备高度的严谨性,只有和传统AI相结合在具体场景具体任务中落地才能发挥其自身的应用价值。