“生成式 AI 提醒我们,很难做出有关于人工智能的预测。
十年前,传统观点认为:人工智能首先会影响体力劳动;然后,是认知劳动;然后,也许有一天它可以做创造性工作。
现在看起来,它会以相反的顺序进行。”——Sam Altman
现在,生成式 AI 在美国投资界有压倒式的火热,我想给大家写一下这个领域的前世今生。
(一)
差不多是在七年前的这个时候,特斯拉创始人埃隆.马斯克和 YC 的前总裁萨姆.奥特曼等六个人,一共出资 10 亿美金,创建了一个人工智能公司 OpenAI。
但是大家都不知道 OpenAI 要干什么。
差不多大概又过了三年半,萨姆宣布抛弃 YC,正式出任 OpenAI 的 CEO。但是大家仍然不知道 OpenAI 要干什么。
萨姆在一些场合,简单地提及了他为什么要去帮埃隆实现 OpenAI。大概意思如下:
萨姆在 28 岁这一年,突然意识到人类不是独一无二的。因为很快,计算机就能复制他大脑。就某些方面,人类可能还有些特殊性,比如创造力、灵感、感受情绪的能力,但计算机,很快也会有自己的欲望和人生目标。
萨姆当时的原话如下:
“当我得知智能是可以被模拟时,我就不再认为人类有什么独特性了。而且相比于人类,机器还有很多优势——人类在输入和输出方面太慢,每秒只能学习两个 bit 数据。但对于计算机,这简直就是慢动作。”
2003 年,瑞典哲学家尼克.博斯特罗姆曾提出过这样一个著名假设:
如果你对一个全能的人工智能下命令,要求它制作尽可能多的回形针。那么在没有其他指令的情况下,它会耗尽地球上所有资源来制造回形针——包括你、我身体里的原子。
换句话说:AI会变得无比强大,但是它没有人类的价值观。
于是,为了帮助全人类做战略防御,萨姆决定和马斯克一起创立 OpenAI。
他们模拟的敌人,就是谷歌旗下的 DeepMind,因为如果世上只有一个 DeepMind,那么假设有一天 DeepMind 出了问题,也许就会出现一个不朽的超级独裁者。这个独裁者会杀光所有竞争对手的研究人员,就像修改一个程序的 Bug 一样。
而 OpenAI 的第一个任务,就是要从谷歌和 Facebook 等营利性巨头公司手里夺取 AI人才和研究人才。
(二)
不过,OpenAI 也有自己的问题。
因为它的出发点是完全“防御性”和”利他性”的,因此,没有人知道它自己想要什么——它的欲望是什么?(尤其是在威胁没有发生时)。
这就像是一个创业者,宣告天下说TA要创业了,但是TA整个行为方式却是在“带发修行”一样。
对啊!他们募集了 10个亿,雇了一支由 30 名研究人员组成的强大团队。但是他们自己想干嘛呢?
埃隆.马斯克后来提出了一个策略,如下:
最好的防御方式,就是让尽可能多的人拥有人工智能。因为,如果每一个人都有 AI 的能力,那么就没有任何一个人或一小部分人可以拥有 AI 的超能力。
听上去有点儿Web3的去中心化的意思。
OpenAI 的第二个问题是:它需要很多很多钱,用于支付各种成本,而且顶级人才通常要股票期权,如果 OpenAI一直是一家非盈利公司,它如何从谷歌、Facebook手里抢到这些人才呢?
为解决这个问题,2019年OpenAI宣布重组公司结构——母公司为非盈利组织,子公司为盈利性公司,然后,开始采用“盈利上限”模式,即:
把早期投资者的回报,限制在其原始资本的 100 倍,以防止投资者驱动公司只关注利润。并且后面的投资者,回报上限只会更低。
去年年底,萨姆在和美国媒体透露这段历史时说道:
“我们在这个问题上进行了非常艰苦的斗争,因为我们知道,如果你真的制作了 AGI,基本上就像按下了一个按钮(水龙头),然后说出,你希望公司能够赚多少钱。”
几乎就在OpenAI 定下“盈利上限”模式的 2019 年 3 月,萨姆宣布卸任 YC 总裁,正式出任 OpenAI 的 CEO。
同年 7 月,OpenAI 接受了微软的 10 亿美金投资。
(三)
其实萨姆上面这句话,也为后来 OpenAI 深不可测的公司估值埋下了伏笔。
根据美媒刚刚曝出的消息:在去年的时候,OpenAI 的估值就已经接近于 200 亿美金(当时,红杉资本、老虎环球、A16z 从 OpenAI 几个老股东手里以这一估值买下了公司老股)。
一举击败 Grammarly,成为目前全球人工智能领域由自然语言 AI 提供支持的估值最高的公司。
此外,这批投资者对 OpenAI 的估值定价,是其远期销售额的 500-800 倍。因为埃隆提出的策略是——“让尽可能多的人拥有人工智能”,也就是说,OpenAI 会出售自己 AI 产品的许可。
接下来的故事,就是过去几个月大家看到的了。
今年 4 月,OpenAI 发布了自己开发的机器学习模型 Dall-e 2,专门用于从自然语言描述中生成数字图像。
7 月,OpenAI 正式开卖 Dall-e 2 的图像生成软件许可。其他创业公司可以通过购买这个许可来推出服务。
由此,Dall-e 2 正式掀开了硅谷这些机器人生成的艺术作品,在社交媒体上的一场 AI 生成艺术盛宴。
(四)
不过,让 OpenAI 始料未及的是:
实际上从 7 月开始,以及过去几个月里,整个硅谷和欧洲都出现了几家被疯狂关注的生成式 AI 公司,如下:
1,OpenAI 的 DALL-e 2:
2,Midjourney:7 月 12 日公测,8 月已经盈利,用户用 Discord 机器人命令通过 Midjourney 来创建艺术品,团队由 Leap Motion 的联合创始人 David Holz 领导,商业模式是使用免费增值业务模式。
3,Jasper AI:今年夏天融资时估值超过 15 亿美元。
4,Stable Diffusion:一个类似 DALL-e 2 的文本到图像创建平台。
5,Stability AI:英国公司,创始人是前对冲基金经理。与 OpenAI 不同,其利用开源 AI 技术,这也是他向客户和投资者推销的重点。8 月,该公司融种子轮时估值为 1 个亿,9 月跃升为 5 亿,上周一,宣布公司估值为 10 个亿。两个月内估值从 1 亿跃升到了 10 亿美金。
6,谷歌和 Facebook:扎克伯格刚刚秀完了自己的肌肉——公司“利用 AI 迅速生成视频”的能力,但目前不清楚这些大公司是否会将这些能力商业化。
需要注意的是:以上,公司 3 使用的技术是 OpenAI 的 DALL-e 2。
但让 OpenAI 意想不到的是:开源 AI 软件的兴起——尽管 OpenAI 在发布了 Dall-e-2 后激发了互联网的想象力,但之后公司 4——Stable Diffusion 的突然出现,让 AI 世界大吃一惊。通过使用 Stable Diffusion,包括 Stability AI 和 Runway 在内的初创公司,已经为他们的客户开发了内容创建工具。
而公司 5——Stability AI,其实已经激怒了很多 AI 初创公司和投资者,因为他创始人的一些言论,极端的如把自己描述成为是 Stable Diffusion 的“背后公司”。
真实情况是:Stable Diffusion 在 2021 年由德国学术研究人员和现视频编辑应用开发公司 Runway 的研究人员 Patrick Esser 创建并发布。包括 Runway 现在也在用 Stable Diffusion 的技术来为自己客户开发工具,并且 Runway 还捐赠了计算能力来制作 Stable Diffusion 的第一个版本。
然后,Stability AI 曾在今年早些时候联系 Esser ,并提出捐赠计算能力以进一步改善 Stable Diffusion 的想法,并因此提高了后者软件对文本的理解以及它可以生成的图像质量。
但这并不意味着它是 Stable Diffusion 的“背后公司”,并且实际上,其他创业公司也可以用 Stable Diffusion 的能力来卖类似的图像生成产品。
Stability AI 的 CEO 因此已激怒一些研究人员,并到处把自己与 OpenAI 做对比。
根据美媒的报道:为了应对竞争,目前 OpenAI 正与微软秘密洽谈新一轮的融资,如果成功,OpenAI 的估值可能又要跃升。
(五)
最后,上周其实是生成式 AI 的突破时刻。
除了有一堆公司融资新闻外,投资界的各大思想家也纷纷发表了自己对这一领域的看法。
我最喜欢的是下面这两段阐述。来自 Midjourney 的大卫.霍尔茨:
"我们不认为这真的是关于艺术或者制作深度伪造品,而是关于——我们如何扩展人类的想象力。因为当计算机的视觉想象力,比 99% 的人类更好时,这意味着什么呢?
这不意味着我们将停止想象。汽车比人类快,但不意味着我们停止了步行。当我们在很远的距离上移动了大量东西时,我们需要飞机、轮船或汽车。因此,我们将这项技术视为是——‘想象力的引擎’。”
以及,来自于萨姆.奥特曼的这一段话:
“生成式 AI 提醒我们,很难做出有关于人工智能的预测。
十年前传统观点认为:人工智能首先会影响体力劳动;然后,是认知劳动;然后,也许有一天它可以做创造性的工作。
现在看起来,它会以相反的顺序进行。”
但就像为何我用了如此长的篇幅来讲 OpenAI 的诞生故事一样,我有一种不详的预感:
因为你知道:当一个有超能力的东西出现时,也许类似《指环王》的故事就要上演了。
相关阅读:如此简单的一个企业级应用Grammarly,估值高达130亿美金
说明:因为各种各样的原因,我在微信公号写的东西和我在知识星球写的不太一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)
老星球用户续费请用这个二维码: