摘要:Deepmind推出名为Lyria的音频模型,可生成带有乐器和人声的高品质音乐。Lyria模型针对音乐生成的挑战,解决了音乐信息密度高、音乐序列中的连续性维持困难、多声部和乐器的协调等问题。其最大特点是能够生成包含乐器和人声的音乐,并擅长进行音乐变换和延续的任务。通过与YouTube合作,Deepmind还将Lyria模型开发为音乐创作工具Dream Track,用户可生成多样化的配乐,并选择艺术家的音乐风格进行创作。未来,Deepmind计划将AI应用于更多领域,如旋律生成、Remix音乐转换和乐器伴奏添加等。
摘要:OpenAI内斗升级,743名员工联名信要求董事会集体辞职,否则集体跳槽微软。这一行动意图将OpenAI变为一家非盈利组织,而不再是公司。其中包括OpenAI首席科学家Ilya Sutskever在内的大部分员工都支持这一行动。虽然OpenAI董事会正在考虑后路,但目前面临巨大压力。同时,OpenAI董事会正试图招募新成员以增加票数,并已就可能与Anthropic合并进行接触。
摘要:百度创始人李彦宏在财报电话会上表示,百度正在利用文心大模型对广告系统进行重构,包括生成式创意、生成式定向等服务,预计将在四季度增加数亿元的收入。百度第三季度财报显示,营收达344亿元,超出市场预期,调整后净利润达72.67亿元,同比增长23%。百度还公布了文心大模型4.0版本的发布和应用情况,目前文心一言用户数达到7000万,覆盖4300个场景。此举将进一步推动百度的AI发展,并积极推进其多款AI原生应用的上线。
摘要:OpenAI宣布将基于ChatGPT的文本转语音功能开放给所有免费用户,用户可通过手机应用程序设置打开功能。该系统通过采样配音演员录制的音频,创建具有不同口音和风格的自定义声音。用户可体验到更加自然、人类化的对话功能,支持暂停、中断、更换音色等操作,并提供文字版记录。这项功能的推出对于广大用户来说具有重要意义,因此本条新闻评分较高。
摘要:推特邀请部分用户体验全新的Grok AI聊天体验,界面简洁。未购买Premium+订阅的用户会受到提示购买,每月费用为16美元。Grok AI相比其他聊天AI的不同在于它有幽默感。Grok通过公开数据进行训练,目前尚不清楚使用了哪些数据。另外,Grok能够实时访问X平台,这是一个巨大的优势。
本文介绍了一种新的准确且并行的解码算法——前瞻解码,用于加速大型语言模型(LLM)的推断过程。前瞻解码通过同时提取和验证n-gram来打破自回归解码的顺序依赖性,利用雅可比迭代方法实现。前瞻解码不需要草稿模型或数据存储,可线性减少解码步骤的数量,并与每个解码步骤使用的FLOPs成正比。它能够加速LLM推断,减少延迟,并且适用于对响应时间要求高的应用。
亚马逊最新功能是使用生成式AI从客户评论中生成摘要。该功能将数千条评论总结为简短的段落,并在评论上方提供了AI生成的产品属性。这个功能目前正在测试中,仅对美国部分移动购物者开放。
更多AI工具,参考国内AiBard123,Github-AiBard123