发布日期:2023.12.24
阿里团队推新AI模型I2VGen-XL:单张静止图像就能生成高质量视频 (msn.cn)
主要内容:视频合成领域迎来新突破,阿里团队提出I2VGen-XL模型,通过静态图像引导实现高质量视频生成。I2VGen-XL模型通过两阶段策略,解耦语义与细节,以单张图像为引导实现视频合成。研究人员收集了庞大数据集,包括3500万文本-视频对和60亿文本-图像对,提高模型的语义准确性和细节连续性。在与顶级方法的比较中,I2VGen-XL展示出更丰富、多样化的运动,具有良好的泛化能力,适用于不同图像类型。
项目体验网址:https://top.aibase.com/tool/i2v
发布日期:2023.12.25
TACO:开源最大规模、面向复杂任务的代码生成训练数据集与评测基准_腾讯新闻
主要内容:智源研究院推出TACO代码生成数据集,为模型提供更具挑战性的训练数据和评测基准,规模庞大、质量高,挑战当前流行模型,促进代码生成领域创新。
论文:https://arxiv.org/abs/2312.14852
智源开放数据仓库:Data Hub
发布日期:2023.12.24
李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
主要内容:研究人员最近提出了一种名为「代码链」(CoC)的创新方法,将编码逻辑与自然语言理解相结合,以提升大型语言模型(LLM)基于代码的推理能力。CoC允许LLM生成伪代码来分解难题,并通过LMulator执行有效代码,模拟无效代码。在BIG-Bench Hard基准上,CoC实现了84%的准确率,比先前的技术提高了12%。此外,CoC在18项任务中超过了人类的平均表现。CoC非常适合机器人技术,可以进行语义和算法推理,其表现令人惊艳。
论文地址:https://arxiv.org/pdf/2312.04474.pdf
发布日期:2023.12.23
2023计算机科学7项重大突破!「P与NP」50年经典难题,大模型密集涌现上榜
主要内容:2023年,计算机科学领域大事件人人都能脱口而出,火遍全网的ChatGPT一系列大模型、AI作画神器Midjourney,AI视频生成Gen-2、Pika飞速迭代。具体如下:
Top 1:50年P与NP难题,「元复杂性」理论开路
Top 2:大模型涌现,黑盒谁能打开
Top 3:40年前算法,找到最短路径
Top 4:AI生图爆火,背后技术沉淀多年
Top 5:30年后,量子因数分解运算速度飙升
Top 6:密码学+AI的隐藏秘密
Top 7:向量注入语义,让LLM推理更高效
发布日期:2023.12.25
2023 年被誉为人工智能之年:ChatGPT 领衔全球最受欢迎的 AI 工具 (chinaz.com)
主要内容:从 2022 年 9 月到 2023 年 8 月,ChatGPT 获得了超过 140 亿次访问量,成为世界上最受欢迎的生成式 AI 工具。Writerbuddy.ai 是一家在线内容写作公司。Writerbuddy 利用流行的 SEO 软件 SEMrush 分析了超过 3000 种人工智能工具,以确定今年最常使用的工具。总体来看,前 50 名的 AI 工具吸引了超过 240 亿次访问,其中大多数访问者为男性用户。以下是根据排名的前 10 大最受欢迎的 AI 工具:
1. ChatGPT(AI 聊天机器人)
总访问量:146 亿次
2. Character.ai(AI 聊天机器人)
总访问量:38 亿次
3. Quillbot(AI 写作)
总访问量:11 亿次
4. Midjourney(图像生成器)
总访问量:5 亿次
5. Hugging Face(数据科学)
总访问量:3.16 亿次
6. Bard(AI 聊天机器人)
总访问量:2.41 亿次
7. NovelAI(AI 写作)
总访问量:2.38 亿次
8. Capcut(视频生成器)
总访问量:2.03 亿次
9. Janitor AI(AI 聊天机器人)
总访问量:1.92 亿次
10. Civitai(图像生成器)
总访问量:1.77 亿次
发布日期:2023.12.25
谷歌考虑用人工智能取代部分员工 (msn.cn)
主要内容:谷歌正考虑通过新的人工智能工具自动化广告销售等职位,可能导致一些员工被重新分配或解雇。谷歌推出人工智能工具,使广告销售团队的一些成员不再需要,考虑解雇或重新分配。除广告工作外,随着人工智能发展,更多传统职位可能被自动化取代,涉及多个行业。谷歌用人工智能替代员工可能从长期视角增加公司利润,但引发关切与社会讨论。
发布日期:2023.12.24
英伟达官方盘点2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界
主要内容:英伟达在2023年的研究重点涵盖了人工智能、机器学习和高性能计算等领域。其中,英伟达的Neuralangelo项目使用神经网络重建3D物体,能够从手机视频和无人机拍摄的视频中重建出高保真的大规模场景。此外,英伟达的Magic3D模型可以从文字描述中生成3D模型,其速度比谷歌的DreamFusion更快。在机器人领域,英伟达的Eureka系统可以让GPT-4直接教机器人完成基本动作。在图像生成方面,英伟达的Latent Diffusion Models用于高分辨率视频生成。此外,英伟达还研究了CALM方法,用于训练可操纵虚拟角色在物理模拟中执行动作;通过比赛视频让虚拟角色学习网球技能;高效、高质量的网格优化方法——FlexiCubes等。这些研究成果展示了英伟达在AI领域的创新能力和技术实力。
发布日期:2023.12.23
智能澎湃,大有可为——机器之心2023年度榜单揭晓
主要内容:这一年,ChatGPT 引爆的「百模大战」在国内外科技领域打响,没有一家公司敢在这样一个充满变革机遇的时间窗口松懈。ChatGPT、Midjourney、Pika Lab等现象级应用已经足以让他们感受到大模型尚未完全爆发的潜力,也让他们感觉自己身处各种新的现象级应用爆发的前夕。机器之心正式揭晓「AI 中国」机器之心 2023 年度榜单,希望用这份榜单记录下中国 AI 在这一年的波澜壮阔,展望即将到来的宏伟蓝图。(此网页包含多个领域排名,可前往查看)
发布日期:2023.12.23
OpenAI计划新一轮融资,估值超1000亿美元
主要内容:全球领先的AI公司OpenAI正在计划进行新一轮的融资,估值可能超过1000亿美元。这将使OpenAI成为美国第二大初创公司,仅次于伊隆·马斯克的SpaceX。此次融资的具体条款、估值和时间安排等细节尚未最终确定。自2022年11月发布ChatGPT以来,OpenAI的估值一直在飙升,显示出人工智能热潮的持续升温。此外,OpenAI还在考虑更长远的问题,如用于通用型人工智能的算力,并已与阿联酋王室成员控制的G42就为一家新芯片合资公司筹集资金进行了讨论。
发布日期:2023.12.24
奥特曼年终17条总结爆火!OpenAI总裁:违反直觉但真实
主要内容:OpenAI CEO奥特曼,就给2023打上了一个新标签——“世界开始认真对待人工智能的一年”。并将他的思考总结为17条经验,起了个标题叫《我希望有人早点告诉我这些》。OpenAI自家人也前往转发。OpenAI产品负责人Joanne Jang就分享说:“这就是我留在OpenAI的原因:我们的最高管理层对废话零容忍。”总结如下:
17. 与优秀的人共事是人生最美好的体验之一。