每日一看大模型新闻(2023.11.24)OpenAI内斗五天完整始末,背后是人类持续两百年的恐惧;零一万物:上线Yi-34B-Chat微调模型及量化版;能总结经验、持续进化,上交把智能体优化参数

1.产品发布

1.1阿里巴巴推大规模音频语言模型Qwen-Audio

发布日期:2023.11.24

开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!-CSDN博客

主要内容:阿里巴巴首次推出Qwen-Audio系列,标志着在大规模音频语言模型领域取得显著突破。采用层次标签的多任务框架,成功解决了预训练音频模型面临的多样化任务挑战。Qwen-Audio-Chat支持多轮对话和各种音频中心场景,展现了其通用音频理解能力。

项目网站:

https://link.zhihu.com/?target=https%3A//github.com/qwenlm/qwen-audio

1.2零一万物:上线Yi-34B-Chat微调模型及量化版

发布日期:2023.11.24

零一万物 Yi-34B-Chat 微调模型及量化版正式上线

主要内容:零一万物已经在Hugging Face、ModelScope等开源社区平台正式发布了Yi-34B-Chat和Yi-6B-Chat微调模型。此外,他们还提供了4bit、8bit量化版模型,可以直接在消费级显卡(如RTX3090)上使用,为开发者提供了更多选择。

模型地址:

https://huggingface.co/01-ai/

ModelScope 魔搭社区

1.3中科闻歌雅意2.0将于12月15日发布

发布日期:2023.11.24

12·15,硬核来袭:全面升级雅意2.0大模型,不容错过!

主要内容:中科闻歌将于12月15日在北京举办雅意2.0发布会,发布政企安全可靠大模型,专注于政府智能和商业智能。据介绍,该模型从零开始预训练、模型架构自主研发,支持百亿/千亿多参数规格,兼容国产算力,支持企业级部署,覆盖10+种主流语种,并将开源开放数据、模型、应用。

2.技术更新

2.1视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效

发布日期:2023.11.24

视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效

主要内容:近期,多家公司发布了新的视频生成模型,包括Runway的Gen-2、Meta的Emu Video和Stability.ai的Stable Video Diffusion (SVD)。最新的研究成果PixelDance在这方面取得了突破,其生成结果的动态性显著优于其他模型。PixelDance提供了两种不同的视频生成模式:基础模式和高级魔法模式。用户只需提供一张指导图片和文本描述,PixelDance就能生成具有高度一致性和丰富动态性的视频。此外,PixelDance在公开的WebVid-10M数据集上仅用1.5B大小的模型就达到了上述效果。目前,PixelDance正在积极迭代模型效果,未来几个月将发布可供试用的模型。

论文地址:https://arxiv.org/abs/2311.10982

demo 地址:Make Pixels Dance: High-Dynamic Video Generation

2.2 Meta对Transformer架构下手了:新注意力机制更懂推理

发布日期:2023.11.24

Meta对Transformer架构下手了:新注意力机制更懂推理

主要内容:Meta研究者提出了一种名为System 2 Attention(S2A)的新注意力机制,以解决大型语言模型(LLM)在处理复杂任务时可能出现的问题。他们利用LLM遵循指令的能力,通过提示模型生成应注意的上下文,使其专注于相关的信息,避免受到不相关或带有偏见的输入的影响。实验证明,S2A在处理包含干扰性观点的问题时,比标准的LLM具有更高的事实性和客观性。例如,在修正后的TriviQA数据集上,S2A将事实性从62.8%提高到80.3%,并在GSM-IC数学应用题中将准确率从51.7%提高到了61.3%。这项研究得到了Yann LeCun的推荐。

论文地址:https://arxiv.org/pdf/2311.11829.pdf

2.3能总结经验、持续进化,上交把智能体优化参数的成本打下来了

发布日期:2023.11.24

能总结经验、持续进化,上交把智能体优化参数的成本打下来了

主要内容:针对大模型智能体难以利用自身交互经历进化自身交互性能的问题,上海交通大学跨媒体语言智能实验室(X-LANCE)提出了 RLEM 框架,设计了「忆者」智能体。实验结果显示,通过增强以外置经验记忆,并辅以强化学习对经验记忆更新,「忆者」智能体能够充分利用自身的交互经历进化交互策略,显著提升在基准任务集上的性能。该工作为大模型智能体进化自身性能,以及将大模型智能体与强化学习结合,提供了富有价值的方案和见解,未来或有机会在此方向上探索得更深更远。

论文地址:https://arxiv.org/abs/2306.07929

3.商业动态

3.1 OpenAI内斗五天完整始末,背后是人类持续两百年的恐惧

发布日期:2023.11.24

OpenAI内斗五天完整始末,背后是人类持续两百年的恐惧_澎湃号·湃客_澎湃新闻-The Paper

主要内容:这篇文章总结了OpenAI公司内部的夺权大戏,从最初的混乱局面到新董事会的成立,以及各方反应和最终的回归。内容包括:

当地时间11月16日周四

奥特曼收到Ilya Sustekever(伊尔亚·苏茨克维)发来的信息,要求周五中午谈话。

当地时间11月17日周五

从奥特曼被罢免,到布罗克曼辞职,到OpenAI三名高级研究人员效仿宣布辞职,到微软发声明,这天是个黑色星期五。

当地时间11月18日周六

事件持续发酵,奥特曼在考虑下一步该怎么走。

当地时间11月19日周日

这天可统称为“谈判日”,但最后无奈谈崩了,事情的走向开始不受控制。

当地时间11月20日周一

尽管谈崩了,但不得不赞叹萨提亚对于整件事情的处理,奥特曼和布罗克曼将加入微软的消息,让微软不但稳住了股价且股价上涨,微软赢麻了。

当地时间11月21日周二

事情开始降温,就连最初参与罢免奥特曼的董事会成员之一、OpenAI首席科学家苏茨克维都改变态度,包括董事会在内的每个人都开始回归理性,并将OpenAI重新组合起来。

当地时间11月22日周三

阿尔特曼将重返OpenAI担任CEO,并与Bret Taylor(雷特·泰勒)(主席)、Larry Summers(拉里·萨默斯)、Adam D’angelo(亚当·德安杰洛)组成新的董事会。

你可能感兴趣的:(chatgpt,人工智能,自然语言处理,prompt,语言模型,机器学习,embedding)