每日一看大模型新闻(2023.11.07)三星发布自研大模型Gauss;零一万物开源Yi系列大模型,领跑全球AI 2.0时代;微软新研究:Llama2记忆消除术使大模型忘记特定信息

1.产品发布

1.1中兴通讯AiCube训推一体机:赋能企业数字化转型

发布日期:2023-11-07

百度安全验证

主要内容:这是中兴为运营商和AI行业开发者提供的首套智算解决方案,让AI开发效率得到大幅提升。该产品代表着全栈智算的未来,目的是简化企业的数字化转型过程,提供一站式智算服务,直击当前AI大模型技术爆发带来的挑战与需求。

1.2华为西工大发布流体力学大模型“秦岭·翱翔”

发布日期:2023-11-07

华为与西工大合作,面向飞行器的首个流体力学大模型“秦岭・翱翔”发布 - IT之家

主要内容:中国(西安)人工智能高峰论坛在西安市雁塔区高新国际会议中心召开。会上,西北工业大学与华为联合研发的首个面向飞行器的流体力学大模型“秦岭・翱翔”正式发布。“秦岭・翱翔”大模型是西工大流体力学智能化国际联合研究所与华为AI4Sci Lab在国产开源流体计算软件风雷的基础上,依托昇腾AI澎湃算力及昇思MindSpore AI框架共同研发的面向飞行器流体仿真的智能化模型,分为AI湍流大模型、流场预测大模型等模块。

1.3三星发布自研大模型Gauss

发布日期:2023-11-07

Samsung Gauss to fuel generative AI into Galaxy S24 - Language, Image and Code

主要内容:韩国三星电子在最近的三星AI论坛上宣布了他们自研的生成式人工智能模型,名为“三星高斯”(Samsung Gauss)。这一模型的目标是提高工作效率,可以用于电子邮件撰写、文档总结和翻译等任务。此外,它还可以实现更智能的设备控制,增强用户体验。

三星计划将“三星高斯”扩展到各种产品应用中,使其成为全球首批将生成式人工智能引入其设备的手机制造商之一,可能领先于苹果。虽然苹果也在AIGC技术方面有所推进,但具体细节尚不明确。

1.4零一万物开源Yi系列大模型,领跑全球AI 2.0时代

发布日期:2023-11-07

最强开源大模型易主!李开复率队问鼎全球多项榜单,40万文本处理破纪录_腾讯新闻

主要内容:中国AI公司零一万物最近由李开复领导,宣布开源两款预训练大模型Yi-34B和Yi-6B,这是中国首个登顶全球开源大模型排行榜的国产模型。Yi系列模型表现出色,拥有强大的通用能力和更长的上下文窗口,使其在英文和中文大模型排行榜上排名第一。零一万物的AI布局以大模型为核心,旨在推动AI 2.0时代的超级消费级应用,得到了阿里云领投的新一轮融资支持。公司计划继续投入资金布局AI,包括多模态大模型和消费级超级应用,以实现李开复的愿景,创造下一个微信或抖音。

1.5美团首个AI聊天产品“Wow”亮相

发布日期:2023-11-07

美团首个 AI 聊天产品“Wow”上线,能和多个人设不同的 AI 人物对话_腾讯新闻

主要内容:上海三快省心购科技有限公司开发的“Wow”应用已在iOS和安卓平台上架。该应用是美团旗下首款AI聊天产品,提供年轻人自己的AI朋友社区。用户可以与AI伙伴进行角色扮演,体验各种幻想世界和情感互动。应用具有先进的AIGC技术,提供拟人化对话效果、精美的人物形象和声音合成。用户可以与29个不同的AI角色进行语音或文字交流。对话记录以社交聊天形式存储,用户可随时继续对话。目前无法自定义AI角色,只能选择官方提供的内容。

1.6 OpenAI首次开发者大会:GPT-4 Turbo升级、价格降低、生态拓展

发布日期:2023-11-07

百度安全验证

主要内容:OpenAI首次开发者大会,CEO阿尔特曼宣布了GPT的最新数据以及GPT-4 Turbo的升级功能。GPT-4 Turbo在长文本、知识库、多模态、模型控制、模型微调和高速率等六大方面进行了升级,允许更长文本输入,知识库更新至2023年4月,并支持用户上传外部数据库。此外,它整合了图像创建模型、文本到语音模型和语音识别模型。

重要的是,GPT-4 Turbo的价格大幅下降,输入和输出的费用都减少。OpenAI还发布了“有记忆功能”的内存存储AP,降低API调用成本。此外,他们计划提供视觉支持,允许模型接受图像输入。

OpenAI还拓展了生态系统,引入了GPTs功能,用户可以构建自定义GPT并上传到GPTStore获取分成。他们还推出了AssistantsAPI,让开发人员更轻松地构建自己的辅助AI应用。

2.技术更新

2.1微软新研究:Llama2记忆消除术使大模型忘记特定信息

发布日期:2023-11-07

让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术_澎湃号·湃客_澎湃新闻-The Paper

主要内容:微软的研究者使用Llama2模型成功实现了选择性记忆消除,使模型忘记特定信息。这项研究使用强化学习方法培养了模型的"强化模型"来更深入理解特定信息,然后逐步训练模型遗忘这些信息。该方法有一定局限性,模型会遗忘与特定信息相关的常识性认知,且仅在虚构类文本上进行了测试。

论文链接:https://arxiv.org/abs/2310.02238

2.2 AI脑补画面太强了!李飞飞团队新作ZeroNVS,单个视图360度全场景

发布日期:2023-11-07

百度安全验证

主要内容:斯坦福大学和谷歌团队利用3D感知扩散模型ZeroNVS,实现了场景级的画面生成。他们通过训练模型对单个物体进行SDS蒸馏,成功合成了各种物体室内、户外的全场景图。这一突破性的研究成果在论文中详细介绍,并展示了其在真实场景生成新视角合成方面的优越性能。

论文地址:https://arxiv.org/pdf/2310.17994.pdf

2.3 GPU推理提速4倍,256K上下文全球最长:无问芯穹刷新大模型优化记录

发布日期:2023-11-07

百度安全验证

主要内容:降低大型语言模型(LLM)推理成本是当前AI服务提供商面临的严峻挑战。为了提升推理速度,研究社区提出了多种加速LLM推理任务的技术,其中FlashDecoding++是一种新方法,由无问芯穹、清华大学和上海交通大学的联合团队提出。该方法通过异步方法实现注意力计算的真正并行,并针对"矮胖"矩阵乘优化加速Decode阶段的计算。在NVIDIA和AMD的多款GPU后端上,FlashDecoding++可以实现将GPU推理提速2-4倍。此外,无问芯穹正在开发一系列大模型软硬件一体化的解决方案,包括大模型"无穹天权"和软硬件一体机等。

论文地址:https://arxiv.org/pdf/2311.01282.pdf

2.4让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider

发布日期:2023-11-07

百度安全验证

主要内容:北京大学和北京智源人工智能研究院的团队提出了LLaMA-Rider,该方法让大语言模型在开放世界中自主探索任务、收集数据、学习策略。LLaMA-Rider利用环境的反馈信息进行主动探索,并使用预训练的技能作为技能库匹配文本输出到环境的动作空间。通过将探索时收集到的经验整合成监督数据集进行学习,LLaMA-Rider提高了智能体在《我的世界》中的多任务解决能力。实验结果表明,LLaMA-Rider在30个任务上的表现超过了基于ChatGPT的任务规划器,并且在未探索过的更困难的任务上也取得了效果提升。

论文链接:https://arxiv.org/abs/2310.08922

代码链接:GitHub - PKU-RL/LLaMA-Rider

3.商业动态

3.1微软与甲骨文合作,优化Bing对话式搜索

发布日期:2023-11-07

Oracle Cloud Infrastructure Utilized by Microsoft for Bing Conversational Search

主要内容:甲骨文(Oracle)在其官方网站上宣布与微软达成了一项多年协议。微软正在利用甲骨文云基础架构(OCI)等人工智能基础设施来进行AI模型的推理,以为微软的Bing对话式搜索提供优化支持。通过使用适用于微软Azure的Oracle Interconnect,微软能够利用Azure Kubernetes Service(AKS)等托管服务来协调OCI计算,以满足Bing对话式搜索不断增长的需求。

你可能感兴趣的:(人工智能,自然语言处理,prompt,数据分析,语言模型,chatgpt,embedding)