发布日期:2023.11.24
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!-CSDN博客
主要内容:阿里巴巴首次推出Qwen-Audio系列,标志着在大规模音频语言模型领域取得显著突破。采用层次标签的多任务框架,成功解决了预训练音频模型面临的多样化任务挑战。Qwen-Audio-Chat支持多轮对话和各种音频中心场景,展现了其通用音频理解能力。
项目网站:
https://link.zhihu.com/?target=https%3A//github.com/qwenlm/qwen-audio
发布日期:2023.11.24
零一万物 Yi-34B-Chat 微调模型及量化版正式上线
主要内容:零一万物已经在Hugging Face、ModelScope等开源社区平台正式发布了Yi-34B-Chat和Yi-6B-Chat微调模型。此外,他们还提供了4bit、8bit量化版模型,可以直接在消费级显卡(如RTX3090)上使用,为开发者提供了更多选择。
模型地址:
https://huggingface.co/01-ai/
ModelScope 魔搭社区
发布日期:2023.11.24
12·15,硬核来袭:全面升级雅意2.0大模型,不容错过!
主要内容:中科闻歌将于12月15日在北京举办雅意2.0发布会,发布政企安全可靠大模型,专注于政府智能和商业智能。据介绍,该模型从零开始预训练、模型架构自主研发,支持百亿/千亿多参数规格,兼容国产算力,支持企业级部署,覆盖10+种主流语种,并将开源开放数据、模型、应用。
发布日期:2023.11.24
视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效
主要内容:近期,多家公司发布了新的视频生成模型,包括Runway的Gen-2、Meta的Emu Video和Stability.ai的Stable Video Diffusion (SVD)。最新的研究成果PixelDance在这方面取得了突破,其生成结果的动态性显著优于其他模型。PixelDance提供了两种不同的视频生成模式:基础模式和高级魔法模式。用户只需提供一张指导图片和文本描述,PixelDance就能生成具有高度一致性和丰富动态性的视频。此外,PixelDance在公开的WebVid-10M数据集上仅用1.5B大小的模型就达到了上述效果。目前,PixelDance正在积极迭代模型效果,未来几个月将发布可供试用的模型。
论文地址:https://arxiv.org/abs/2311.10982
demo 地址:Make Pixels Dance: High-Dynamic Video Generation
发布日期:2023.11.24
Meta对Transformer架构下手了:新注意力机制更懂推理
主要内容:Meta研究者提出了一种名为System 2 Attention(S2A)的新注意力机制,以解决大型语言模型(LLM)在处理复杂任务时可能出现的问题。他们利用LLM遵循指令的能力,通过提示模型生成应注意的上下文,使其专注于相关的信息,避免受到不相关或带有偏见的输入的影响。实验证明,S2A在处理包含干扰性观点的问题时,比标准的LLM具有更高的事实性和客观性。例如,在修正后的TriviQA数据集上,S2A将事实性从62.8%提高到80.3%,并在GSM-IC数学应用题中将准确率从51.7%提高到了61.3%。这项研究得到了Yann LeCun的推荐。
论文地址:https://arxiv.org/pdf/2311.11829.pdf
发布日期:2023.11.24
能总结经验、持续进化,上交把智能体优化参数的成本打下来了
主要内容:针对大模型智能体难以利用自身交互经历进化自身交互性能的问题,上海交通大学跨媒体语言智能实验室(X-LANCE)提出了 RLEM 框架,设计了「忆者」智能体。实验结果显示,通过增强以外置经验记忆,并辅以强化学习对经验记忆更新,「忆者」智能体能够充分利用自身的交互经历进化交互策略,显著提升在基准任务集上的性能。该工作为大模型智能体进化自身性能,以及将大模型智能体与强化学习结合,提供了富有价值的方案和见解,未来或有机会在此方向上探索得更深更远。
论文地址:https://arxiv.org/abs/2306.07929
发布日期:2023.11.24
OpenAI内斗五天完整始末,背后是人类持续两百年的恐惧_澎湃号·湃客_澎湃新闻-The Paper
主要内容:这篇文章总结了OpenAI公司内部的夺权大戏,从最初的混乱局面到新董事会的成立,以及各方反应和最终的回归。内容包括:
当地时间11月16日周四
奥特曼收到Ilya Sustekever(伊尔亚·苏茨克维)发来的信息,要求周五中午谈话。
当地时间11月17日周五
从奥特曼被罢免,到布罗克曼辞职,到OpenAI三名高级研究人员效仿宣布辞职,到微软发声明,这天是个黑色星期五。
当地时间11月18日周六
事件持续发酵,奥特曼在考虑下一步该怎么走。
当地时间11月19日周日
这天可统称为“谈判日”,但最后无奈谈崩了,事情的走向开始不受控制。
当地时间11月20日周一
尽管谈崩了,但不得不赞叹萨提亚对于整件事情的处理,奥特曼和布罗克曼将加入微软的消息,让微软不但稳住了股价且股价上涨,微软赢麻了。
当地时间11月21日周二
事情开始降温,就连最初参与罢免奥特曼的董事会成员之一、OpenAI首席科学家苏茨克维都改变态度,包括董事会在内的每个人都开始回归理性,并将OpenAI重新组合起来。
当地时间11月22日周三
阿尔特曼将重返OpenAI担任CEO,并与Bret Taylor(雷特·泰勒)(主席)、Larry Summers(拉里·萨默斯)、Adam D’angelo(亚当·德安杰洛)组成新的董事会。