RLAIF方法与传说中的函数‘Q‘,揭露OpenAI那不为人知的Qstar计划

早晨刚起来,看群里新哥转了这个帖子:

RLAIF方法与传说中的函数‘Q‘,揭露OpenAI那不为人知的Qstar计划_第1张图片

RLAIF方法与传说中的函数‘Q‘,揭露OpenAI那不为人知的Qstar计划_第2张图片

      帖子不长,但是基本是爆炸类的新闻了!这个应该也就是Sam之前被董事会诟病的所谓隐瞒了的真相!

      在讲解这个帖子之前,先要普及2个概念:

1- RLAIF:

      不是TGIF,虽然今天确实是周五

RLAIF方法与传说中的函数‘Q‘,揭露OpenAI那不为人知的Qstar计划_第3张图片

      RLAIF是Google今年9月新出来的论文,论文地址:2309.00267.pdf (arxiv.org)(以后我这号再改名,直接叫博洋带你读论文算了...)

你可能感兴趣的:(人工智能,深度学习,AIGC)