『大模型笔记』国外大神对DeepSeek R1的科普!

国外大神对DeepSeek R1的科普!

文章目录

  • 一、Explainer: What's R1 & Everything Else?
    • 时间线
    • 推理与 Agent
    • 推理模型 ≠ Agent
    • 推理为什么重要
    • 推理需要变得廉价
    • R1 的重要意义
    • AI 的发展走势
    • 预训练规模扩张的路走不通了
    • 推理阶段的规模定律
    • 缩小模型体量(新的规模定律?)
    • 强化学习(新的规模定律?)
    • 模型蒸馏(新的规模定律?)
    • 2025 年的预测
    • 地缘政治:Distealing
    • 结论
    • 讨论
  • 二. 参考文献

  • 姐妹们,兄弟们,最近的 AI 圈子是不是有点“猛猛的”?
  • 不仅咱们吃瓜群众头晕,连圈内大佬都在 抓狂。一会儿冒出个 R1,一会儿又蹦出来 o1、o3,还愣是不给你个 o2……让人满脸问号。
  • 别怕!这篇文章帮你把最近的 AI 发展梳理得明明白白。就是专门写给那些“感觉自己好像应该知道,但又真的没跟上节奏”的朋友们。AI 进化速度太离谱,我们要抱紧彼此,别在这股风潮里被吹晕。

一、Expla

你可能感兴趣的:(大模型笔记,笔记,Deepseek,deepseek,R1,Deepseek,v3,GPT,O1,GPT,O3)