以ChatGPT为代表的现象级互联网应用的出现,掀起了人工智能领域新一轮技术浪潮。作为新一代信息技术,生成式人工智能通过对人类“脑力”的无限延伸,赋予人们对于追求美好生活的更大想象空间。与此同时,生成式人工智能被滥用带来的数据泄露、虚假信息等风险挑战也纷至沓来,各国陆续推出或完善针对生成式人工智能的监管方案。
《生成式人工智能服务管理暂行办法》(以下简称《办法》)于2023年5月23日国家互联网信息办公室2023年第12次室务会会议审议通过,并经国家发展和改革委员会、教育部、科学技术部、工业和信息化部、公安部、国家广播电视总局同意,自2023年8月15日起施行。
《办法》是对我国人工智能法律体系与算法治理体系的进一步完善,与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》在治理思路上一脉相承,在治理制度方面创新推进,坚持从生成式人工智能技术特点出发,提出了一系列针对性的发展与治理措施。
《办法》共5章24条,逐条解读如下。
第一条 为了促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,根据《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规,制定本办法。
本条款明确了立法目的与依据。
第二条 利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务(以下称生成式人工智能服务),适用本办法。
国家对利用生成式人工智能服务从事新闻出版、影视制作、文艺创作等活动另有规定的,从其规定。
行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等研发、应用生成式人工智能技术,未向境内公众提供生成式人工智能服务的,不适用本办法的规定。
本条款明确了适用范围。
第三条 国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。
本条款明确了原则。
第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:
(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;
(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;
(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;
(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。
本条款是《办法》的核心条款,详细解读如下:
(1)价值观问题
生成式人工智能具有价值观属性。生成式人工智能模型经过训练后,对一些概念具备了较为稳定的“认知”,围绕相关概念的生成内容往往表现出惊人的一致性。**大模型的生成结果取决于训练语料,语料的选取与标注直接决定了大模型的价值观。**一旦模型在训练过程中引入涉及国家主权、意识形态等方面的有害信息,在模型实际应用中很可能呈现放大化输出。
(2)非歧视性问题
有偏见的数据将导致有偏见的算法。数据集是机器学习、人工智能的基础,如果数据集本身缺乏代表性,就不能够客观地反映现实情况,算法决策就难免有失公允。在生成式人工智能的开发中,需要付出更大努力来收集更少偏见和更具代表性的数据,确保生成内容符合非歧视性要求。
(3)知识产权等商业问题
生成式人工智能在训练过程中,会使用到大量未经授权的素材,并且以黑盒的方式进行加工和输出,引发了一系列的侵权问题,部分还涉及商业机密等。
如,马斯克称微软在未得到用户的同意的情况下,非法利用推特数据训练其人工智能模型,侵犯了用户的隐私和版权。
(4)合法权益保护问题
以ChatGPT为代表的大语言模型主要以人机对话的方式提供服务,用户在使用的时候一般需要注册并登陆。通过收集用户的问题以及用户对输出内容的反馈,可以掌握大量用户的个人隐私信息,深度洞悉用户的心理状体。这样大模型就具备了针对不同用户生成不同内容的能力,可以更具精准、有效的影响用户观点与立场。
(5)真实准确的问题
以ChatGPT为代表的大语言模型生成的内容逻辑性强、结构合理、表述流畅,会在不理解上下文的情况下,以“权威身份”回答问题,经常会出现一本正经胡说八道的情况,容易对用户造成误导(《被ChatGPT骗了!再用ChatGPT可要小心了》),甚至可以用来生成大规模虚假消息。
第五条 鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。
支持行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等在生成式人工智能技术创新、数据资源建设、转化应用、风险防范等方面开展协作。
本条款明确了明确政府鼓励人工智能创新发展。
第六条 鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新,平等互利开展国际交流与合作,参与生成式人工智能相关国际规则制定。
推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。鼓励采用安全可信的芯片、软件、工具、算力和数据资源。
本条款强调鼓励芯片、算法、软件和数据的自主创新发展。由于目前芯片主要依赖英伟达公司的GPU卡,算法主要基于谷歌公司的Transfomers算法,软件则主要以pytorch、tensorflow为主,数据方面也缺少高质量的中文语料,因此特别强调芯片、算法、软件和数据资源的自主创新。
第七条 生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:
(一)使用具有合法来源的数据和基础模型;
(二)涉及知识产权的,不得侵害他人依法享有的知识产权;
(三)涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;
(四)采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性;
(五)《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》等法律、行政法规的其他有关规定和有关主管部门的相关监管要求。
本条款是《办法》的关键条款之一,一是明确了训练数据来源的合法性,来源渠道需合法合规,不得使用窃取或其他非法方式获取的数据;二是明确了数据内容本身的合法性,不得侵害知识产权与个人隐私;三是要求提高训练数据质量。
第八条 在生成式人工智能技术研发过程中进行数据标注的,提供者应当制定符合本办法要求的清晰、具体、可操作的标注规则;开展数据标注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升尊法守法意识,监督指导标注人员规范开展标注工作。
本条款明确了数据人工标注的要求,人工标注是确保数据内容准确的关键环节。
第九条 提供者应当依法承担网络信息内容生产者责任,履行网络信息安全义务。涉及个人信息的,依法承担个人信息处理者责任,履行个人信息保护义务。
提供者应当与注册其服务的生成式人工智能服务使用者(以下称使用者)签订服务协议,明确双方权利义务。
本条款明确了生成式人工智能服务提供者的责任。
第十条 提供者应当明确并公开其服务的适用人群、场合、用途,指导使用者科学理性认识和依法使用生成式人工智能技术,采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务。
本条款明确了生成式人工智能服务提供者需提供必要的提示与指导。
第十一条 提供者对使用者的输入信息和使用记录应当依法履行保护义务,不得收集非必要个人信息,不得非法留存能够识别使用者身份的输入信息和使用记录,不得非法向他人提供使用者的输入信息和使用记录。
提供者应当依法及时受理和处理个人关于查阅、复制、更正、补充、删除其个人信息等的请求。
本条款明确了要保护个人信息与隐私。
第十二条 提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。
本条款明确了针对人工智能生成的内容要有明确标识。
第十三条 提供者应当在其服务过程中,提供安全、稳定、持续的服务,保障用户正常使用。
第十四条 提供者发现违法内容的,应当及时采取停止生成、停止传输、消除等处置措施,采取模型优化训练等措施进行整改,并向有关主管部门报告。
提供者发现使用者利用生成式人工智能服务从事违法活动的,应当依法依约采取警示、限制功能、暂停或者终止向其提供服务等处置措施,保存有关记录,并向有关主管部门报告。
本条款明确了违法内容处置要求。
第十五条 提供者应当建立健全投诉、举报机制,设置便捷的投诉、举报入口,公布处理流程和反馈时限,及时受理、处理公众投诉举报并反馈处理结果。
本条款明确了投诉举报机制。
第十六条 网信、发展改革、教育、科技、工业和信息化、公安、广播电视、新闻出版等部门,依据各自职责依法加强对生成式人工智能服务的管理。
国家有关主管部门针对生成式人工智能技术特点及其在有关行业和领域的服务应用,完善与创新发展相适应的科学监管方式,制定相应的分类分级监管规则或者指引。
本条款明确了监管部门职责。
第十七条 提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
本条款明确了具有舆论属性或者社会动员能力的生成式人工智能服务的安全评估及备案机制。
第十八条 使用者发现生成式人工智能服务不符合法律、行政法规和本办法规定的,有权向有关主管部门投诉、举报。
本条款明确了投诉举报机制。
第十九条 有关主管部门依据职责对生成式人工智能服务开展监督检查,提供者应当依法予以配合,按要求对训练数据来源、规模、类型、标注规则、算法机制机理等予以说明,并提供必要的技术、数据等支持和协助。
参与生成式人工智能服务安全评估和监督检查的相关机构和人员对在履行职责中知悉的国家秘密、商业秘密、个人隐私和个人信息应当依法予以保密,不得泄露或者非法向他人提供。
本条款明确了对监管部门的透明机制。
第二十条 对来源于中华人民共和国境外向境内提供生成式人工智能服务不符合法律、行政法规和本办法规定的,国家网信部门应当通知有关机构采取技术措施和其他必要措施予以处置。
本条款明确了针对境外违法服务的处置机制。
第二十一条 提供者违反本办法规定的,由有关主管部门依照《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规的规定予以处罚;法律、行政法规没有规定的,由有关主管部门依据职责予以警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停提供相关服务。
构成违反治安管理行为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任。
本条款明确了违反规定的处置机制。
第二十二条 本办法下列用语的含义是:
(一)生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。
(二)生成式人工智能服务提供者,是指利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人。
(三)生成式人工智能服务使用者,是指使用生成式人工智能服务生成内容的组织、个人。
第二十三条 法律、行政法规规定提供生成式人工智能服务应当取得相关行政许可的,提供者应当依法取得许可。
外商投资生成式人工智能服务,应当符合外商投资相关法律、行政法规的规定。
第二十四条 本办法自2023年8月15日起施行。