内测挤爆的文心一言,能否迎战GPT-4?

2月7日,百度宣布推出ChatGPT类型人工智能产品“文心一言”,并于3月份完成内测向公众开放。一个多月后的今日,在北京百度总部和上海张江人工智能岛,文心一言如期而至。

百度董事长兼CEO李彦宏介绍,文心一言在商业文案创作、数理推算等方面有突出能力,同时他也承认,文心一言“并没有完全ready(准备好)”。

背负着国内市场的期待,文心一言为何要匆忙上线?业内人士认为,国内GPT技术的发展,要以抢占应用场景为先机,再辅助以算法技术的迭代,“边学边赶”才能有机会与国际AI巨头迎头赶上。

具备更强中文理解力

发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。据介绍,AICG内容回答事实性问题时容易出现事实性差错,而文心一言延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。

在商业文案创作场景中,文心一言也完成了给公司起名、写口号和新闻稿的创作任务。

“AI要写好一篇稿子,除了需要准确理解我们的意图,还要有清晰的表达能力。”李彦宏解释称,人类常说“读万卷书”,AI则是 “读书破千亿卷”。文心一言大模型的训练数据包括万亿级网页、数十亿的搜索数据和图片、百亿级的语音日均调用数据以及5500亿条事实的知识图谱等。“有研究表明,数据规模足够大,参数达到千亿级,大模型就可能发生‘智能涌现’,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。”

文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

值得一提的是,文心一言扎根于中国市场的大语言模型,因而具备中文领域先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。

除了日常的对话,李彦宏现场还展示了文心一言生成文本、图片、音频和视频的能力,还能够生成四川话等方言语音。不过遗憾的是,视频生成能力因成本较高,现阶段还未对所有用户开放。

“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

常用功能表现正常,漏洞仍然不少

“十月怀胎,一朝分娩。”李彦宏在发布会上如是形容文心一言的诞生。

据悉,文心一言的上线已连续多日进行压力测试,亚洲目前最大的单体智算中心山西阳泉百度智算中心,已经将算力提升到每秒可以完成400亿亿次浮点运算,并与全国其他几座智算中心共同为文心一言提供算力支持。

除了日常对话外,文心一言还提供了写报告、AI作画和查知识点三个功能模板。

文心一言在“传统媒体融合转型”为题的报告中,不仅解释了“媒体融合”的意义,还给出了数字化转型、内容创新、用户分析等多方面建议。懂经哥发现这些内容并非是搜索引擎的直接呈现,而是经过大模型的整理和归纳。在查知识点和AI作画方面,文心一言也正常表现,通常在一分钟内能够给出反馈。

不过,懂经哥在试用时发现,文心一言在交流方面仍有不少漏洞,时常出现前后矛盾的现象。另外,在对话过程中缺少上下文之间的呼应,更像是一对一的应答。

也有部分内测用户表示,同样的问题抛给文心一言和GPT-4,两者的答案有一定差距。比如《三体》的续写,“文心一言”的答案比较抽象,比如生命的意义、人类的宇宙关系,而GPT-4的回答更具体、更有冲突感,比如类人机器人的崛起、黑暗森林法则的挑战等。

试用申请挤爆测试网页

本月15日,OpenAI推出了GPT-4,市场反馈优于ChatGPT,文心一言今日上线,难免与GPT-4将有所比较。

百度早在2019年推出了文心大语言模型,以此为基础的文心一言也属于百度多年来的“厚积薄发”,不过就连李彦宏自己也承认:“不能说我们完全ready了,文心一言对标ChatGPT,甚至是对标GPT-4,门槛仍然是很高的,我自己测试感觉还是有很多不完美的地方。”

或许是担心文心一言的稳定性,李彦宏在发布会现场并未使用现场实时演示,而是采用提前录制好的视频进行了文心一言的能力展示。李彦宏也表示,该模型目前还存在一定不足,“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

资本市场对文心一言的反应也不尽理想。今日午后,百度的港股出现持续下挫,跌幅一度达到近10%,随后略有收窄。截至收盘,百度股价报收125.1港元/股,跌6.36%,总市值3458亿港元。

文心一言为何仓促上线?百度今日披露的两组数据能说明问题——短短一个月的时间,超过650家合作伙伴宣布加入文心一言生态;发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。

“大家都希望能早一点用上最新最先进的大语言模型。”难怪李彦宏直言,“文心一言”并不完美,但市场有需求必须要推出来。

对于“用市场换时间”的做法,360创始人周鸿祎也公开表示认同。“目前国内发展GPT技术,首先要占据应用场景,同步全力发展核心算法技术。”他表示GPT技术的应用场景需要复杂的工程化和商业化的能力,以及丰富的数据清洗和人工标注的经验,如果等国内的算法赶上GPT-4再上马,市场就错过了。

GPT概念是风口还是泡沫?

除了文心一言外,国内已有多家机构和企业推出类GPT大模型。今年2月,小冰公司的ChatGPT应用“小冰链(X-Chain of Thought & Action)”开启了小范围内测。3月初,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS,目标是打造一个具有中国特色的中文大型语言模型;360也表示将借鉴微软与OpenAI能力结合所推出的New Bing模式 ,推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品。阿里达摩院类ChatGPT产品已处于内测阶段,京东云将推出产业版ChatGPT—ChatJD……更多大模型也在逐步内测推进中。

据国际数据公司(IDC)测算,2021年全球市场人工智能市场收入规模达850亿美元,并将于2025年突破2000亿美元大关,复合年均增长率高达24.5%。另据中信建投报告显示,中国人工智能行业发展势头凶猛,在全球人工智能产业化地区中仅次于美国和欧盟,约占全球市场规模的9.6%,2022年中国人工智能市场规模达2729亿元。

GPT概念到底是风口还是泡沫?国研新经济研究院创始院长朱克力告诉懂经哥:“如百度等技术型公司已在大模型领域深耕多年,AI技术较为成熟,文心一言的出现无疑是利好,抓住这一机会能优先抢占市场。”他也劝告投资者切勿盲目跟风,一些企业缺少技术优势,仅以ChatGPT为噱头赢得股市青睐,一旦泡沫戳破将损失惨重。”

“AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。”李彦宏预测,大语言模型将带来云计算、模型精调和应用服务提供商三大产业机会,“基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。”

国信证券研报也认为,AIGC应用场景有望全面爆发,作为生产力工具还将不断推动聊天机器人、数字人、元宇宙等领域发展。作为推动人工智能发展的三大要素,算法目前仍在迭代,数据积累量不够,算力也刚刚突破,“三兄弟”的突破还将不断创造出新的业态和应用。

你可能感兴趣的:(ChatGPT,人工智能,知识图谱,自然语言处理)