3月16日,百度正式推出国内首款生成式AI产品“文心一言”,可支持文学创作、文案创作、数理推算、多模态生成等功能。
“文心一言”基于全栈自研的AI基础设施进行学习和训练:
①文心知识增强大模型:“文心一言”的模型层核心能力,该产品主要采用ERNIE系列文心NLP模型,拥有千亿参数级别的ERNIE 3.0 Zeus为该系列最新模型,进一步提升了模型 对于不同下游任务的建模能力,大大拓宽了“文心一言”的应用场景。
②飞桨深度学习平台:“文心一言”的框架层核心能力,系业内首个动静统一的框架、首个 通用异构参数服务器架构,支持端边云多硬件和多操作系统,为文心大模型提供有效、快捷、完整的训练框架。
③昆仑芯2代AI芯片:“文心一言”的芯片层核心能力,采用自研XPU-R架构,通用性和性能显著提升;256 TOPS@INT8和128 TFLOPS@FP16的算力水平,较一代提升2-3倍, 保障“文心一言”算力需求。
文心一言是国内关注度极高的首款类ChatGPT产品,一经发布便涌入了大量的用户。虽然百度创始人李彦宏坦诚:文心一言并不完美,大开脑洞的文生图也一度引起了大众热议。
此外,百度上周推出了企业级大模型服务平台“文心千帆”,不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链。未来,文心千帆还会支持第三方的开源大模型。
3月30日,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生向媒体表示,腾讯正在研发类ChatGPT聊天机器人。对于腾讯的聊天机器人是集成到QQ、微信,还是通过腾讯云向B端用户服务,汤道生说:“都会有。”
腾讯在大模型领域的布局早已有之,其“混元”系列AI大模型覆盖了NLP、CV、多模态等基础大模型以及众多行业/领域大模型。这成为了腾讯构建类ChatGPT产品的坚实技术储备。
2022年5月,腾讯混元AI大模型在CLUE总排行榜、阅读理解、大规模知识图谱三个榜单同时登顶,一举打破三项纪录。
目前,混元AI大模型已经广泛应用于腾讯微信搜索、腾讯广告等业务场景,提升了搜索体验和广告推荐精准度。
据报道,腾讯针对ChatGPT对话式产品成立了“混元助手(HunyuanAide)”项目组,由腾讯首席科学家、腾讯AI Lab及Robotics X实验室主任张正友博士负责。
根据最新的腾讯内部学习会议内容:
1、在大模型进展方面:腾讯AI大模型六个BG都有参与,其中TEG(技术工程事业群)在算法上更偏整体,其他BG更偏行业。
2、在水平方面:其万亿参数的水平,相比ChatGPT性能更强,但可能比GPT4比有所不足。混元大模型目前偏自然语言,而GPT4支持多模态。
3、在前景方面:后续在商业化推进中,大模型可能会接入微信、游戏、短视频、广告、TOB端等业务。
在全球范围内,腾讯与谷歌、OpenAI等巨头相比,在大语言模型AI的技术研究和应用上仍存在差距。不过,凭借庞大的用户基数、多元化的业务布局以及强大的技术实力,腾讯在大语言模型AI的发展中仍具有其独特的竞争优势。
不久前腾讯发布财报后,腾讯总裁刘炽平也透露了腾讯聊天机器人的计划,“不急于求成,先打好基础,再追求新进展,我们的第一款产品将会是多次迭代之后的产品,整个过程将是长期的”。
2月8日,阿里巴巴内部一款标名“预发布”的应用被“打码”曝光,被认为是达摩院版的ChatGPT新品。从曝光截图来看,阿里巴巴可能将AI大模型技术与钉钉生产力工具深度结合。
此外,这款传说中的产品可以实现的功能不止于知识回答,还包括AI绘画、代码生成、小说续写、文案撰写、写诗作词。
媒体向阿里巴巴内部人士证实,目前公司确实在研发相关产品,并已经处于内测阶段。据透露,目前该款产品的命名还没有最终确定。
早在2022年9月,达摩院曾发布过“通义”大模型系列。据透露,阿里版ChatGPT,正是基于通义大模型体系进行融合升级。
据报道,推出的通义大模型底座基于统一学习范式OFA等底层技术打造,具备了能搞定多种任务的“大一统”能力:不引入新增结构,单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务。升级后,更是可以处理超过包括语音和动作在内的30多种跨模态任务。
但据知情人士透露,打造中文ChatGPT的生态,这个定义对于阿里来说可能窄了一点。相比之下,阿里更希望能引领中文大模型的发展趋势。
2月23日,从多个独立信源处获悉,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力。字节跳动相关技术负责人对此回应:技术中台在这些领域有探索,还很初期,不成熟。一名知情人士透露,语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右。图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。
值得注意的是,字节跳动有不少AI产品,比如:剪映,就是一款视频智能生成工具。
2月10日,京东云官微发布,京东云将推出“产业版”ChatGPT,产品名字叫:ChatJD。并公布ChatJD的落地应用路线图“125”计划。
1个平台:ChatJD智能人机对话平台
2个领域:零售、金融
5个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类