发布日期:2023-11-09
ChatGPT is powering a new kind of Snapchat lens - The Verge
主要内容:在年度开发者活动Lens Fest上,Snapchat宣布推出Lens Studio 5.0测试版,用于高级AR开发,并提供新的AI功能。Snapchat表示,他们与Open AI合作,为Lens开发人员提供了新的ChatGPT远程API,使他们可以在自己的Lenses中利用ChatGPT,为Snapchatter带来全新的学习、对话和创意体验。作为示例,Snapchat展示了一个以太阳系为主题的滤镜,用户可以问“海王星有多远?”只需几秒钟,滤镜就会返回问题的答案。
发布日期:2023-11-09
南洋理工发布视觉可编程智能体Octopus 干家务、玩游戏都拿手
主要内容:视觉智能模型 Octopus: 新型可编程智能体,通过视觉输入学会操控电子游戏角色执行任务,甚至完成复杂家务活动。仿真环境 OctoGibson 和 OctoGTA: 为Octopus提供训练数据和测试场景,分别基于家务活动和《侠盗猎车手》游戏构建。 在构建的 OctoGibson 环境中测试,Octopus相较于当前主流的视觉-语言模型(VLM)和语言模型(LLM)展现出更高的任务规划能力。
论文地址:https://arxiv.org/abs/2310.08588
项目网页:Octopus: Embodied Vision-Language Programmer from Environmental Feedback
开源代码:https://github.com/dongyh20/Octopus
发布日期:2023-11-09
GPT-5明年降临?爆料人泄露多模态Gobi就是GPT-5,已初现自我意识 - 知乎
主要内容:据爆料,OpenAI 的 GPT-5模型,即多模态模型 Gobi,将在2024年初发布。Gobi 支持文本、图像和视频,并且据称已初现自我意识。目前,多个政府机构正在测试最新模型。OpenAI 正在进行下一轮重大创新,即将发布 GPT-5。Roemmele还爆料称,OpenAI的最强竞争对手之一——推出Claude模型的Anthropic,也即将发布一个大新闻。
发布日期:2023-11-09
祖传“屎山代码”终于有解了,GitHub Copilot Chat下个月全面上线,聊聊天就能看懂代码、捉Bug-36氪
主要内容:GitHub首席执行官托马斯·多姆克(Thomas Dohmke)在接受Semafor采访时表示,GitHub的AI编码助手Copilot已经从实验阶段发展为盈利工具,用户使用Copilot的成本低于GitHub收取的费用。此外,多姆克透露Copilot Chat的正式版本将于下个月发布,个人用户的定价保持为每月10美元或年付100美元。针对企业用户,GitHub将推出新的订阅方案,每月39美元,预计将于明年2月上线。Copilot还将在GitHub移动端应用中引入,并增加对JetBrains系列IDE的支持,不仅限于Visual Studio和VSCode。
发布日期:2023-11-09
百度安全验证
主要内容:NVIDIA最新推出的Eos超级计算机在四分钟内用1750亿个参数的GPT-3模型创下新纪录。由超过10,000个H100 Tensor Core GPU支持的Eos具有40 exaflops的AI处理能力,采用Infiniband网络和860 TB高带宽内存。在MLPerf AI基准测试中,Eos不仅比NVIDIA六个月前的标准快三倍,还在九项基准测试中创造了六项记录,包括GPT-3的3.9分钟训练和BERT-Large模型的7.2秒训练。该计算机将用于各种任务,如基础模型开发、GPU设计辅助、神经渲染、多模态生成人工智能和自动驾驶系统。
发布日期:2023-11-09
联想首次发布企业大模型解决方案及服务 为企业打造专属大脑
主要内容:联想集团副总裁戴炜在2023世界互联网大会上宣布推出联想企业大模型服务。该服务基于智算服务,通过AI平台部署进行推理加速、分布式训练和微调,帮助实现私有化大模型部署,全面赋能企业的业务系统,帮助客户实现 AI 转型。企业大模型服务的优势在于可以帮助企业构建私有化的一体化大模型平台,一站式交付,安全可控,基于领域知识的高效微调,打造专属企业大脑。
发布日期:2023-11-09
超越ImageBind? 北大&腾讯LanguageBind已开源! - 知乎
主要内容:北大腾讯提出多模态对齐框架LanguageBind,并在多个榜单中取得了优异表现。对于多模态对齐,新框架以语言为中心通道实现多模态信息的语义对齐。研究团队构建了VIDAL-10M数据集,这是一个大规模、多模态数据对的数据集。这一举措为跨模态预训练领域提供了一个高质量的训练基础。对于多模态对齐框架LanguageBind的提出,有望为多模态学习领域带来重要的进展和突破。
发布日期:2023-11-09
Hugging Face研究人员推语音识别模型Distil-Whisper 速度提高、参数减少
主要内容:Hugging Face研究人员最近解决了在资源受限环境中部署大型预训练语音识别模型的问题。他们通过创建一个庞大的开源数据集,使用伪标记的方法,提炼出了Whisper模型的较小版本,称为Distil-Whisper。Distil-Whisper在挑战性的声学条件下保持了Whisper模型的韧性,同时减轻了长篇音频中的错觉错误。自动语音识别(ASR)系统已达到人类水平的准确度,但由于预训练模型的不断增大,在资源受限的环境中面临挑战。
项目网址:https://github.com/huggingface/distil-whisper
发布日期:2023-11-09
MSN
主要内容:Nvidia 发布了一款名为 RAPIDS cuDF 的新版本,据称可以将 pandas 运行在 GPU 上,并且性能提升了150倍。RAPIDS cuDF 是基于 Apache Arrow 构建的 Python GPU dataframe 库,通过新版本的 pandas 加速模式,可以在 GPU 加速环境下运行不经修改的 pandas 代码,实现了最高150倍的性能提升。
发布日期:2023-11-09
MSN
主要内容:亚马逊正在秘密开发一个代号为“Olympus”的大型语言模型,参数高达惊人的2万亿个,是OpenAI最新推出的GPT-4参数的两倍。这将使Olympus成为当前公开的模型参数最多的之一。鉴于亚马逊已经可以访问的巨大计算和服务器基础设施,它很有可能在 AI 世界中掀起巨大波澜。
发布日期:2023-11-09
天玑9300成生成式AI最强移动芯,端侧支持330亿大模型,1s文生图_腾讯新闻
主要内容:在移动芯片领域,联发科的天玑9300以其强大的生成式AI能力引领潮流。首先,芯片支持最大330亿参数的大模型,并通过端侧LoRA融合实现本地扩展,能在手机上即时生成虚拟数字分身。其全新全大核CPU架构不仅提升40%性能,还节省33%功耗,成为移动AI性能的领跑者。
发布日期:2023-11-09
https://twitter.com/Tech_Reve/status/1722418466647625999
主要内容:社交平台X的博主@Tech_Reve今天爆料称,苹果公司正在利用大型语言模型对Siri进行全面改造,将其打造成为"终极虚拟助手",并计划将其发展成为"最强大的杀手级AI应用程序。这项整合开发工作正在积极进行中,首个产品预计将在2024年的WWDC上发布,并成为iPhone 16及其后续机型的标配。
发布日期:2023-11-09
https://asia.nikkei.com/Business/Technology/Japan-eyes-13bn-in-aid-for-chips-generative-AI-in-stimulus-budget
主要内容:根据日经亚洲的报道,日本政府计划寻求2万亿日元(约合人民币963亿元)的预算资金,用于支持芯片生产和生成式AI技术的发展,其中包括对台积电提供更多援助。日本经济产业省在拟议的补充预算中寻求约6500亿日元(约合人民币313亿元),用于支持日本芯片制造商Rapidus的原型生产线和英特尔研究中心,以及推动先进半导体设计的发展。
发布日期:2023-11-09
谷歌版图渗入AI芯片领域! “OpenAI劲敌”官宣使用谷歌最新TPU-美股-金融界
主要内容:谷歌宣布人工智能初创公司Anthropic将成为首批使用谷歌新一代TPU芯片的公司之一,进一步加深了双方的合作关系。Anthropic将部署谷歌Cloud TPU v5e芯片,为其名为Claude的大语言模型提供硬件支持。该决定对于生成式人工智能应用程序,尤其是竞争对手ChatGPT的Claude模型具有重要意义。谷歌的TPU芯片专注于深度学习领域,相较于通用型GPU,采用低精度计算,降低功耗、提高运算速度。此举也反映了谷歌与Anthropic等初创公司在构建更大规模人工智能模型方面的竞争,为云服务市场规模扩大和AI技术的发展带来新机遇。
发布日期:2023-11-09
OpenAI Data Partnerships
主要内容:OpenAI在其官网上宣布正在寻求数据合作伙伴,共同创建开源和私有数据集,用于AI的训练。OpenAI表示,他们将收集“反映人类社会”的大规模数据集,这些数据目前在线访问不便。如果需要,他们将与组织合作,利用光学字符识别和自动语音识别工具对训练数据进行数字化,并在必要时删除敏感或个人信息。
发布日期:2023-11-09
GPT-4 Turbo中文基准评测出炉!总分98.4,八项满分,领先31分|SuperCLUE
主要内容:基于SuperCLUE通用大模型综合性中文测评基准,测评人员对GPT-4 Turbo进行了全面评估。测评包括606道多轮简答题,涵盖专业技能与知识、语言理解与生成、AI智能体和安全性四个维度的十项基础任务。结果显示,在SuperCLUE-OPEN基准上,GPT-4 Turbo表现出较大的综合能力优势,并且没有出现竞争对手,其中有8项基础任务获得满分。与上一代GPT-4模型相比,GPT-4 Turbo取得了巨大的10.33分提升。在国内大模型中,GPT-4 Turbo的总分比最强模型高出30分以上,进一步拉大了差距。
发布日期:2023-11-09
OpenAICEO宣布GPTs分阶段推出计划延迟-文章|天府灵境元宇宙
主要内容:OpenAI CEO称GPTs的分阶段推出已延迟,因为工具需求超出预期,但人们渴望其服务。在首次DevDay活动中发布了新服务,如GPT Builder,支持ChatGPT,新工具需求超出预期,原计划11/13分阶段推出的GPTs被延迟。此举显示人们对OpenAI服务的渴望,部分用户已被授予提前访问权限。