AI界的拼多多-中国人工智能初创公司DeepSeek如何与硅谷巨头竞争

这家公司打造出了一款成本更低且颇具竞争力的聊天机器人,其使用的高端计算机芯片数量少于谷歌和OpenAI等美国巨头企业,这凸显出芯片出口管制的局限性。

圣诞节次日,一家名为DeepSeek的中国小型初创公司推出了一款新的人工智能系统,其性能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。

仅此一点就堪称一个里程碑。但这个名为DeepSeek - V3系统的研发团队称,他们迈出了更大的一步。在一篇解释该技术研发过程的研究论文中,DeepSeek的工程师表示,他们仅使用了领先人工智能公司训练其系统所需的高度专业化计算机芯片的一小部分。

这些芯片处于美中紧张技术竞争的核心。随着美国政府努力维持该国在全球人工智能竞赛中的领先地位,它试图限制像英伟达这样的硅谷公司生产的高性能芯片向中国及其他竞争对手的销售数量。

但DeepSeek模型的表现引发了对美国政府贸易限制意外后果的质疑。这些限制迫使中国研究人员利用互联网上随处可得的各种工具另辟蹊径。

根据美国人工智能公司一直在使用的基准测试,DeepSeek聊天机器人回答问题、解决逻辑问题和编写计算机程序的能力与市面上已有的任何产品一样出色。

而且它的研发成本很低,这对一种普遍观点构成了挑战,即只有科技行业最大的公司——且都位于美国——才负担得起打造最先进的人工智能系统。中国工程师表示,打造他们的新系统仅需约600万美元的原始计算能力投入。这比科技巨头Meta打造其最新人工智能技术的花费少约10倍。

“有600万美元可用于投入的公司数量,远远多于有1亿美元或10亿美元可用于投入的公司数量,”专注于人工智能技术的风投公司Page One Ventures的投资人克里斯·V·尼科尔森说。

自2022年OpenAI发布ChatGPT引发人工智能热潮以来,许多专家和投资者得出结论,认为没有哪家公司能在不花费数亿美元购买专用芯片的情况下与市场领导者竞争。

全球领先的人工智能公司使用的超级计算机在训练聊天机器人时,即便没有更多,也会用到多达1.6万个芯片。而DeepSeek的工程师表示,他们仅需约2000个英伟达的专用计算机芯片。

“中国在芯片方面的限制迫使DeepSeek的工程师‘更高效地训练模型,使其仍具竞争力’,”乔治·华盛顿大学专门研究新兴技术与国际关系的助理教授丁杰弗瑞说。

本月早些时候,拜登政府发布了新规定,旨在阻止中国通过其他国家获取先进的人工智能芯片。这些规定是在之前多轮限制措施的基础上制定的,此前的限制措施已阻止中国公司购买或制造尖端计算机芯片。特朗普总统尚未表明他是否会保留或废除这些规定。

美国政府出于对先进芯片可能被用于军事目的的担忧,试图不让中国公司获得这些芯片。

DeepSeek由一家名为幻方资产的量化股票交易公司运营。到2021年,幻方已将其利润投入到购买数千个英伟达芯片上,用于训练早期模型。该公司未回应置评请求,在中国,它因向顶尖大学的应届人才开出高薪,并允诺他们能够钻研最感兴趣的研究问题而吸引人才而闻名。

曾参与DeepSeek早期模型研发的计算机工程师王梓涵(音译)表示,该公司还会聘用没有任何计算机科学背景的人,以帮助这项技术理解并能够创作诗歌,以及在难度极高的中国高考题目中取得好成绩。

DeepSeek不生产面向消费者的产品,这使得其工程师能够完全专注于研究。这意味着其技术不受中国人工智能监管中最严格部分的限制,那些规定要求面向消费者的技术必须遵守政府对信息的管控。

美国的领先公司继续推动人工智能技术的前沿发展。去年12月,OpenAI推出了一个名为o3的新“推理”系统,其性能超越了现有技术,不过该系统尚未在公司之外广泛应用。但DeepSeek不断表明自己也并不落后太远。本月,它发布了自己令人瞩目的推理模型。

在这个快速变化的全球市场中,一个关键因素是一个由来已久的理念:开源软件。和许多其他公司一样,DeepSeek已将其最新的人工智能系统开源,即与其他企业和研究人员分享底层代码。这使得其他人能够使用相同技术打造并推广自己的产品。

旧金山Baseten公司负责开源项目SGLang的首席软件工程师张逸能(音译)表示,虽然中国大型科技公司的员工只能与同事合作,“但如果你从事开源工作,你就是在与全球的人才合作”。他帮助其他人及公司利用DeepSeek的系统打造产品。

2023年,Meta免费分享了名为LLama的人工智能系统,人工智能开源生态系统由此蓬勃发展。许多人认为,只有像Meta这样拥有装满专用芯片的大型数据中心的科技巨头继续开源其技术,这个开源社区才会繁荣发展。但DeepSeek等公司表明,它们同样能够拓展开源技术的影响力。

许多企业高管和专家认为,美国的大型公司不应开源其技术,因为这些技术可能被用于传播虚假信息或造成其他严重危害。一些美国议员已在探讨阻止或限制这种做法的可能性。

但也有人认为,如果监管机构抑制美国开源技术的发展,中国将获得显著优势。他们认为,如果最好的开源技术来自中国,美国开发者将基于这些技术构建他们的系统。从长远来看,这可能会使中国成为人工智能研发的核心。
“开源社区的重心一直在向中国转移,”加州大学伯克利分校计算机科学教授伊恩·斯托伊卡说,“这对美国来说可能是一个巨大的危险,”因为这会让中国加速新技术的开发。

特朗普总统就职几小时后,就撤销了拜登政府一项可能限制开源技术的行政命令。

斯托伊卡博士和他的学生最近打造了一个名为Sky - T1的人工智能系统,在某些基准测试中,其性能可与OpenAI最新的名为OpenAI o1的系统相媲美。他们仅需450美元的计算能力投入。

他们是在由中国科技巨头阿里巴巴发布的两项开源技术基础上实现这一点的。

他们450美元打造的系统不如OpenAI或DeepSeek的新系统强大。而且他们使用的技术不太可能打造出超越领先技术性能的系统。但这个项目表明,即使资源极少的团队也能打造出有竞争力的系统。

多伦多的技术顾问鲁文·科恩从去年12月底开始使用DeepSeek - V3。他说,该系统可与OpenAI、谷歌以及旧金山初创公司Anthropic的最新系统相媲美,而且使用成本低得多。

“使用DeepSeek能帮我省钱,”他说,“这是像我这样的人想用的技术。”

你可能感兴趣的:(AI-人工智能与大模型,人工智能,AI,DeepSeek,大模型)