ChatGPT的言传与意会

【本文发表在“中国社会科学报”2023.3.6】

ChatGPT问世的短短数月内,就迅速升温到前所未有的火爆,上亿注册用户,数千亿产业投资等,大有超过前一波元宇宙热之势。ChatGPT的覆盖面之广,成文速度之快,语言表达之流畅,对话之惬意,大大超出人类写作的平均水平和预期,无疑是AIGC(人工智能生成内容)和NLP(自然语言处理)领域的一大进步,尤其是在我国还成为了现象级热议的科普话题。但具有讽刺意义的是,目前ChatGPT在中国大陆境内还不能直接注册应用,未能摆脱国别、地域的差别化制约,从某种意义上说,其价值取向、服务目的、技术进步、推广应用和发展规划等还是极其受限的。这在人们评点和展望其应用前景的同时也引发了深度思考。

一、ChatGPT的技术特点/征

ChatGPT的基本原理与核心技术是基于统计方法的监督式深度(强化)机器学习,属于AIGCNLP领域,无论是技术上还是应用上都极具潜力,被Science杂志评选为2022年度十大科学突破之一。ChatGPT的出现,使AIGC强化了内容与生产力的连接,不仅停留在表达和含义抽象的艺术类产品,也有对内容的明确反馈和更类似于人类表达习惯的描述,大大推进了NLP的研究进展,迈出了AI大规模推广应用的重要一步。

1. NLP的技术转向和研究范式的变革

ChatGPTChat Generative Pre-trained Transformer)迅速走红和引起轰动的背后,是由于人们惊讶于它远超出前辈的泛用性和大幅度提升的回答问题能力,但其影响远不止这些,可以说是自回归类语言模型的一次翻身仗。NLP领域近些年来对Transformer思想产生的大型预训练模型,从双向语言模型对自然语言的理解,到以自回归语言模型(按语序)更多地应用于自然语言生成任务,ChatGPT所表现出的强大能力让人们相信,自回归语言模型一样能达到甚至赶超双向语言模型,甚至在未来有可能实现统一理解、生成两类任务。

2. LLM交互接口的革新

ChatGPT的最大贡献在于:几乎实现了理想的LLMLarge Language Model,大型语言模型)交互接口,让LLM适配人的习惯命令表达方式,而不是反过来让人去适配LLM,这大大提升了LLM的易用性和用户体验。而这必将启发后续的LLM模型,继续在易用人机接口方面做进一步的工作,让LLM更听话,使LLM技术体系囊括NLP外的更多领域。

归纳ChatGPT最突出形象的特点,可以概括为:能力强大,善解人意。巨量语料、算力的结晶使模型蕴含的知识几乎覆盖了各个领域;其训练过程中加入的人工标注数据,注入了人类偏好知识及一定程度上的价值取向、情感意向、评价判断和表达习惯等,能够理解人的命令,表露出一些“人味”。

3. Transformer

与已有同类技术相比,ChatGPT是应用功能增强型的,而元宇宙是整体建构型的。ChatGPT的核心技术和关键支撑,由最后一个字母T,即Transformer的基本含义和主要功能是:连接、传输、转换和调适等来体现,类似于电网传输中的变压器,借此可跨域跨科、适应于不同应用主体和设施。有了类似的转换器相关技术,人类语言所覆盖的所有领域,都有可能放在同一平台上进行信息和数据的自动化智能化处理。

4. 成本巨大

据业内人士介绍,ChatGPT应用的RLHF技术(带有人类反馈的强化学习),这类预训练模型技术需要拥有3000亿以上单词的语料基础、1750亿个参数的模型;若要训练图形保证误差率在5%以下,就需要1000亿美元左右的投入。仅这几个千亿级的数字,就足以说明AIGC类技术的进展是多么艰难、缓慢,成本巨大。类似的Google LaMDABe/ardYouChatPerplexity AI等,机器与人对话或文本、或语音,间或附以图景画面等形式,它们都只是多“能”而少“智”,在提高规模、速度、效率和精准的功能方面有显著进步,但在激发人类的智慧和创造性,与人类互激共进方面还很弱、很“Low”,远不如人意。所以,只有变革性思维、颠覆性的技术原理出现,才可能会有真正的(强)AI与人类思想情感的深度交流、沟通创造。

二、ChatGPT的应用特点

ChatGPT的出现及相应的产业化商业化落地,将会为从UGC(用户创作)到AIGC的转型提供关键支持,有望加速写作助手、对谈系统、智能客服、代码开发等领域的商业化进程,无疑会赋能造势、推动AI领域打开更广阔的应用空间。

1. 在投资、产业和市场方面的应用

对于大多资本与巨头来说,密切关注和入局ChatGPT赛道,无疑是看中其背后的市场空间,尤其是在跨境电商、游戏开发、企业管理、数字化转型和教育等领域,以及现代高科技生活方式方面的应用。如:营销自动化,综合使用AIGC技术,结合现有的个性化推荐、实时计算能力等,可以解决线上线下协同营销过程中的自动化断点问题,实现营销策略自动生成和迭代、渠道自动分流,并实现自动生成营销话术、广告头图等运营内容,从而实现完整的自动化营销闭环;对于风险识别,基于ChatGPT模型技术,可实现对关键要素提取、资料自动化审核、风险点提示等风控业务流程,提升相关业务的自动化水平。

以生成式问答为主体,结合现有的NLP、个性化搜索引擎和知识图谱等,综合考虑用户个性化需求和购物特点与习惯的提示词标注、知识结构等进行应对用户问题的内容生成和展示,并可以给出索引,既解决现有检索引擎的准确性、个性化难题,又能弥补可信和实时更新问题,在技术上形成互补、用户使用过程中实现完整一致的搜索体验。

2. 数智治理和数字政府建设方面的应用

ChatGPT无疑能强有力地推动政府部门运用各类数字技术来改进政府管理和公共服务,促进政府的经济调节、社会管理和公共服务等职能环节实现数字化转型。在经历主要是个人计算机和第一代互联网技术的应用、移动互联网和社交媒体的应用后,ChatGPT类的人工智能技术会使政府真正加速实现:以大数据和人工智能为代表的新一代信息技术的应用;将ChatGPT用于公共服务体系建设,关切微观主体,全方位获取用户的需求和偏好,将会更好地识别和满足人们的需要,提升公共服务和公共政策的执行效率;可提供决策相关的各类数据,界定决策的预期目标和限定条件,就可使基于大数据的政府智能决策成为可能,获得多种可供选择的政策方案加速推进政府决策的智能化,让政府的政策决策更加科学,减少陈规陋习决策带来的负面影响;也可让公务员和公职人员更加轻松高效地履职,从繁重的文稿准备工作中解放出来,加强信息搜索和加工合成能力,为政府部门的文书准备提供强力支持,快速生成政府工作人员指定的相关文书。

3. 人文社会科学研究领域的应用

ChatGPT对人文社会科学研究无疑也是一个很好的助手,它能整合和输出既有文本、辅助创新和生成新的观点与想法。研究者关注对象、产生想法和提出问题后,可以有效利用ChatGPT超强的数据挖掘/爬虫/获取和文本分析处理能力,促进和升华想法,收集更多以前无法获得的数据,面向现实问题,基于人类自然语言,有望突破现有学科壁垒,必然会对跨学科交叉融合、新文科等新学科建设起着重要的助推作用。

具体来看,可将ChatGPT技术应用于内容创作,结合领域内语料进行适应性训练,多语义识别筛选,对网络语言、虚拟社群、意见领袖和文本计量、政策计量研究等会大有裨益;使用内容生成、结合增强知识图谱技术,可从当前实体关系图中生成扩展图,在知识图谱引擎原有的隐性集团识别、深度链扩散、子图筛选等能力基础上,扩展出更高维度、更大范围的隐性关系识别,能够提升风险识别、反欺诈、反虚假的识别范围和准确程度。ChatGPT的辅助编程,也可使文科人员应用计算机和现代信息技术的能力大大提高;还可利用其进行智能访谈,减少专访员的投入,增强数据的专业性、有效性和价值。

4. 辅助改善日常生活

就应用现状来看,在日常生活中使用ChatGPT可加快完成常规任务,减少重复性劳动,提升生活质量;检测网络设备的常用器具的安全漏洞隐患,增强系统安全性;加快物智互联和物流效率,加强实时控制管理;实时监测和评估人们的身体健康,及时提供调整建议,改善和保障健康;有利于人们有效掌握新兴技术,普及数字知识、技能和应用,充分利用大数据与人工智能技术提高生活便利和幸福感;但也要注意ChatGPT会不可避免地带来社会问题和潜在影响:一是社会规则演变和科技伦理方面的问题;二是收入分配和公平问题,由于要学习新技能、增强自身竞争能力,随之也会带来社会群体分化重构和收入差距拉大的潜在风险。

三、ChatGPT的发展前景

就目前的发展阶段而言,ChatGPT还是定位在语言处理的言传,而对“嗯,好的,看着办吧!”类意会式表达,还不能结合语境进行全面的语义分解和选定。而人类的交流很多是只可意会、不可言传;虽也涉足诗歌、书法和绘画,但对难以言表的眼神、表情、手势和肢体语言,借景寓意、图形可视化可编辑、情景动画创作等领域还基本上是无能为力,其未来发展要逐步完成言传-图景-意会的“三级跳”。

总的来看,人类与机器的分工与边界还是比较明确的,既要看到ChatGPT的省时省工高效,还要看到其依然停留在规定动作;资料积累整理式研究可以大比例地被取代,但基于统计平均得出的共性还难以刻画和满足个性化需求,在人类智慧和创造性方面却乏善可陈。所以,不必担心其会对人类工作的大量替代,它永远只是处在辅助和在在某些方面并行的地步。尤其是对我国AI技术和产业的发展,对AIGC类技术,要趋利避害,少一些趋利性炒作,多一些趋理性思索。

展望前景,基于有监督的深度(增强型)机器学习的ChatGPT已经成为NLP的重要一环和新的突破,它也将会对NLP领域产生重大影响。ChatGPT将为NLP领域带来更多的可能性,能更准确地预测文本序列的概率,根据上下文内容意境自动生成文本,为NLP研究带来更多机会和提供更多便利;构建更复杂的NLP系统,从而实现更高级的功能,如智能客服、图形编辑和可视化输出、机器翻译、文本“创新”和交流表达方式创新及在精神创造方面的虚实交融的新的生产方式等,逐步完成语言、图景和意会三个不同层次阶段的多向连通和无损转换的自动化、智能化处理。

ChatGPT乘风而来、轰鸣前行,人类在探索和追逐AI新技术应用的脚步也从未停歇。但正如:思想是天空中的鸟,在语言的笼子里,也许会展翼,却不会飞翔(纪伯伦语);再如我们时下季节里感受春天,让ChatGPT写一篇描写赞美春天的文章,它会很容易地秒毕,但却表达不出意境,没有深度、温度,没有绚丽花开、鸟鸣蝶舞的画面……而且,在今后相当长时期内,要突破原理认知、相关技术和算力成本约束等,实现人类更需要的意会、智慧激发和创造,引领、设计和充分享受美好的未来!这或许就是AI等未来发展的重要方向和科技向善的道路!

(作者单位:王国成,中国社会科学院数量经济与技术经济研究所,中国社会科学院大学计算社会科学研究中心)

你可能感兴趣的:(chatgpt,人工智能)