“吴军讲ChatGPT“课程的个人总结

人工智能时代, ChatGPT如此火热, 大家恐慌, 焦虑, 大家最关注的是两个问题

  1. 我会不会被取代?
  2. 我有没有机会?

吴军老师(浪潮之巅, 数学之美等), 有门课程, <吴军讲ChatGPT>, 用通俗易懂的语言, 讲解了人工智能的技术原理+前世今生,以及当下火热的ChatGPT的可以做什么, 那些做不了, 然后回答了大家最关心的两个问题, 1. 我会不会被取代 2. 我有没有机会(虽然他说的我有没有机会部分, 我并不是很认同, 但是前面的部分还是还值得学习的.)

课程的内容, 总结如下图所示

一图总结课程内容

课程有20个免费学习的机会, 关注我的公众号, 发送消息后, 链接可分享给你, 先到先得.

内容学习按照章节总结如下:

吴军讲ChatGPT

发刊词: "ChatGPT神话"背后的原理是什么

吴军的论断

  • 它是一个被神化的语言模型的衍生品

世界上各种自然神,都是人创造出来的,但是人从此匍匐于它们的脚下。而人这么做,是因为不知道各种自然现象背后的原因,简单地讲,就是不懂得科学原理。

第一讲 计算机回答问题, 写诗难吗?

ChatGPT让人感觉神奇的地方

  • 回答复杂问题

  • 能写作

回答复杂问题

  • 对于计算机而言

    • 容易的问题

      • “是谁”“什么时候”“在哪里”“发生了什么事”等等
    • 复杂的问题

      • ”为什么"

      • “怎么做”

  • 让计算机回答问题并不是一件高不可攀的事情,在今天,让它做得比人好是完全能够办得到的。

写作

ChatGPT的能力

  • 信息查询

  • 帮助写作业

  • 应付差事的汇报

  • 核心

    • 一个是理解自然语言,明白人的意图

    • 另一个是产生自然语言的文本,满足人的要求

第二讲 ChatGPT的本质是什么?

底层技术

  • 语言模型

语言模型

  • 人类的语言建立数学模型

  • 语言模型不是逻辑框架,不是生物学的反馈系统,而是由数学公式构建的模型。

如何消除不确定性?

  • 上下文信息的多少

  • 从本质上讲,ChatGPT的原理依然是在很多种候选中,选择一个概率或者是可能性最大的句子

模型的概率怎么计算

  • 今天对于语言模型参数的统计并不是简单的数数,而是要用很复杂的机器学习方法反复计算

第三讲 语言模型是如何进化的

阶段1

  • 语音识别

    • 错误率控制在10%以内

阶段2

  • 语言模型

    • 语法 + 语义

      • 结论

        • 把更多信息,比如语法信息、语义信息,加入语言模型后,人们面临的更大的挑战是,训练模型的计算量变得特别大。
    • 自适应的语言模型

      • 一个人使用语言模型的过程中,他个人输入的信息和间接提供的反馈信息,能够被用来改进语言模型。

阶段3

  • Google大脑

    • 一方面,能够更有效地利用计算资源,这使得语言模型能够越做越大;另一方面,也让模型计算出的概率越来越准确
  • now

    • 今天,计算机对自然语言做语法分析,可以做得比人还准确。通过句子的语法结构,可以理解常见的实词,也就是名词、动词和形容词的含义

第四讲 ChatGPT的能力边界在哪?

被热炒的原因

  • ChatGPT真正可怕的地方在于,按照当前的速度发展下去,不断扩大应用领域,它可能可以解决很多原本需要人类才能解决的问题

语言模型能做的三类事情

    1. 信息形式转换
    • 语音识别

    • 机器翻译

    1. 根据要求产生内容
      [信息由少变多]
    • 回答问题

    • 回复邮件

    • 书写简单的段落

    • 结论

      • 如果语言模型中包含了某个话题的很多相关信息,它就可以产生高质量的文本;否则,它给出的答案或者所写的内容就不着边际。

      • 先给ChatGPT提要求,让它写一篇文章。绝大部分人到此为止了,但是他们会对机器写的文章提出新的修改要求,然后它就会重新给你写,然后你再提要求。这样一来二去,几次迭代下来,文章质量就大有提高了

      • 虽然ChatGPT不能自己创造答案,但它还是很有价值的,它可以减少人的工作量

    1. 信息精简
      [信息由多变少]
    • 对于这一类工作,最终计算机会做得比大部分人更好。这不仅是因为计算机阅读和处理数据快,语言模型强大,更是因为它在做摘要、做分析或者剪辑视频时,能够做到比人客观

    • 写摘要

第五讲 ChaGPT的回答从哪里来?

回答简单问题

  • 利用语言模型回答问题,不是一个问题对一个答案这样简单的匹配,而是对于问题给出多个答案,然后根据答案的概率排序,返回一个最可能的答案

  • “是什么”(What),“是谁”(Who),“在什么时候”(When),“在哪里”(Where),“哪一个”(Which)

回答复杂问题

  • 知道答案, 直接给出

  • 不知道答案, 但是知道答案的基本知识, 推理答案

  • 不知道答案, 根据现有的知识也无法直接推导出答案

ChatGPT如何工作

  • 回答问题也好、写作短文也好,都基于它对现有事实的抽取和整合,或者说归纳总结

  • 知识图谱

    • 单篇文章

    • 全网知识

第六讲 ChatGPT有那些固有缺陷?

结论

  • 有些问题是可以通过改进解决的,有些则是ChatGPT固有的问题,甚至是今天机器学习方法固有的问题,要解决是很难的。

那些问题能够改进

  • 信息量不够导致的错误

  • 创作出来的作文段落乏味

垃圾输入, 垃圾输出

  • 语言模型进化到今天,虽然进步了很多,但依然是一个利用已有的信息预测其他信息的模型,这个性质没有改变

  • 垃圾输入

    • 噪音

    • 正反馈

人工干预的边界

  • 你很难通过人为调高或者调低一些参数来控制ChatGPT的输出结果

第七讲 ChatGPT需要什么资源?

数据

  • 高质量的数据

算力

  • 随着时间的推移,人们对人工智能的要求也在不断提高,需要的算力也在不断增加

算法

  • 除了算力之外,基础的自然语言处理技术,也就是算法,也是实现ChatGPT这些产品必不可少的条件

第八讲 今天人工智能的边界在哪里?

因为无论是什么样的计算机,都只能解决世界上很小一部分问题

ChatGPT的边界是人工智能的边界,而人工智能的边界是数学的边界,数学是有边界的

人工智能能解决什么问题, 不能解决什么问题

  • 数学+计算机的边界

    • 哥德尔

      • 在1931年,年仅25岁的哥德尔证明了,数学体系不可能既完备又一致。也就是说,保证了完备性,结论就会矛盾;保证了一致性,就会有很多结论无法用逻辑推理的方法证明
    • 马季亚谢维奇

      • 希尔伯特第十问题,简单说就是:对于某一类数学问题(不定方程整数解的问题),有没有一个方法,通过有限步,就能判断它有没有解?

      • 希尔伯特关心的只是判断一下它有没有解,还没有考虑如何解决它

      • 马季亚谢维奇的结论对搞计算机的人来讲,既是一个坏消息,也是一个好消息:坏消息是,很多问题就不要想着如何编程去解决了。因为刚才说了,我们压根无法判定它是否有答案,更不要说解决了。换句话说,很多数学问题压根无法用计算机一步步解决;好消息则是,避免了很多人在这里浪费时间

      • 不过,并非所有搞技术的人都知道数学的边界在哪里,依然有无数人在犯错误,试图解决不应该用计算机解决的问题

    • 图灵

      • 图灵不仅给出了可计算的问题,也就是有答案的问题的边界,而且告诉了人们实现计算的方法。这个方法就是图灵机,它能够在有限时间内,判断哪一类问题能够在有限的步骤内计算出来。
  • 人工智能的边界

    • 世界上很多问题都不是数学问题

    • 根据希尔伯特和马季亚谢维奇给出的结论,很多数学问题有没有解是不知道的

    • 在计算机和数学领域,知道一个问题有没有解,叫作“可判定”,这样的问题叫作“可判定问题”。

    • 可判定的问题很多是无解的,只有少部分有答案。

    • 说明

      • 计算能力增加,原来可以计算的问题会算得更快,瞬间解决,但是不可算的还是不可算。

第九讲 ChatGPT为什么会被热炒?

原因

  • 热炒的背后一定有原因,有利益、有恐惧、有哗众取宠,也有无知

多视角分析

  • 投资

    • 发现企业有独特的技术
  • 从业者

    • 兴奋

    • 恐惧

  • 媒体

    • 国内媒体的单方面报道

    • 行业偏见

  • 普通人

    • 将ChatGPT当做神,认为其无所不能

    • 从名称无法理解其内容的新技术

结论

  • ChatGPT既不像很多人讲的那么神奇,也没有那么可怕,但也不是毫无用途

第十讲 ChatGPT能替代什么人?

核心关注的点

  • ChatGPT能取代人吗,或者说能抢人的饭碗么吗?简单的答案是——“能”。但是它只会抢特定人的饭碗,而不是所有的人

什么人会被取代

  • 结论

    • 会被ChatGPT取代的人有三个特点:
      从事不费体力的工作,
      不动脑子的工作,
      不产出信息的工作
  • 案例

    • 不产生信息的人

      • 金融分析师

      • 大部分财经媒体记者

      • 律师助理

      • 普通文员

      • 短视频制作人

      • 大部分公众号写手

    • 低端IT从业者

      • 结论

        • 短期收益可能还不错, 前景越来越暗淡
      • IT开发分类

        • 研发新产品和做解决方案的: 安全的

        • 处理日常事物的: 危险的: 运营, 测试, 数据处理

什么人不会被取代

  • 越是到了各种智能工具不断涌现,做事情越来越便利的时候,从事创造性的工作也就越来越重要。

  • 世界上有很多未知的问题,需要亲力亲为去解决,它们未必都是大问题,但却很重要。比如我们前面提到的,如何知道哪种口罩防护力最高的问题,需要做研究才能搞清楚,不是坐在办公室里凭空推理能解决的。

  • 人工智能可以解决很多问题,但救不了思想上懒惰的人。相反,有了智能工具,反而更加勤奋的人,不仅不会被ChatGPT抢走工作,还会因此有更高的成就

第十一讲 理性看待ChatGPT

投资人的角度

  • 巴菲特

    • “在别人恐惧时我贪婪,在别人贪婪时我恐惧”
  • 如果它真的成为了趋势,等到趋势明显一点再投身进去也来得及。但凡能成为趋势的技术,都会有几十年的发展机会

  • 案例: 电商

    • 8848 的 电商商务公司

    • 阿里巴巴

    • 京东

    • 拼多多

从业者的角度

  • 如果不在这个领域,也不用刻意挤进来,毕竟拿业余爱好和别人的专业去竞争,很难有胜算。做好本职工作的回报一定是最高的

  • 比喻

    • 如同过去加州淘金热时,没有一个淘金者留下姓名,因为他们实际上大都没有挣到钱,只是勉强活下来了而已。但是,卖水、卖工具的人发了财,做牛仔裤的人发了财。
  • 案例

    • 百团大战

      • 团购"百团大战"时, 购买广告公司的图片, 挣了大钱
    • 比特币

      • 买AMD和英伟达的骨片,挣了很多钱

普通人的角度

  • “我在ChatGPT中有什么机会?”对于99%的人,我的回答都是,“你没有机会,甚至要抱着小亏就是赚的心态对待它,这样才不会失望。”

  • 大家将来的命运取决于大环境,而不是某一项现在还看不清的技术

  • 面对一个自己看不清楚的事情,不妨多观察一段时间,再做结论。对于自己不懂的事情,要搞清楚,不要和别人一同去造神

  • 因此,越是别人狂热的时候,我们越需要冷静。未来不是给机会主义者的,而是给踏踏实实把本职工作做好的人的

第十二讲 还有哪些人工智能和科技值得关注

多任务人工智能

  • 四个前提条件

    • 知其然还要知其所以然

    • 具有对身边事物的好奇

    • 具有常识

    • 处理信息的能耗降低几个数量级

生物和医学应用

  • 深度学习在生物和医学上的应用

个人总结

GPT

  • Generative

    • 生成式
  • Pre-trained

    • 预训练的
  • Transformer

    • 转换器

课程有20个免费学习的机会, 关注我的公众号, 发送消息后, 链接可分享给你, 先到先得.

你可能感兴趣的:(读书笔记,思考心得,chatgpt,人工智能,吴军)