o1研发团队首次集体访谈:教AI数r用了一年半
原标题:o1研发团队首次集体访谈:教AI数r用了一年半
导读:
本报记者夏治斌杨让晨石英婧上海报道现在奔驰宝马奥迪很多车型都慢慢涨价了我们的车型以后也会做价格调整日前上海市闵行区一家奥迪门店的销售顾问对中国经营报记者表示目前店内在冲量优惠奥...
本报记者 夏治斌 杨让晨 石英婧 上海报道“现在BBA(奔驰、宝马、奥迪)很多车型都慢慢涨价了,我们的车型以后也会做价格调整。”日前,上海市闵行区一家奥迪门店的销售顾问对《中国经营报》记者表示,目前店内在冲量优惠,奥迪A7L豪华版有一个月的限时优惠,在售价41.87万元的基础上能够优惠约10万元。“但下个月预计要涨...
克雷西 明敏 发自 凹非寺
量子位 | 公众号 QbitAI
笑死,原来o1也像人类一样喜欢赶ddl(手动狗头)。
这是在o1团队的“大型见面会”上,OpenAI创始成员Wojciech Zaremba揭开的o1“黑历史”。
包括Zaremba在内的18名团队成员,在首席研究官Bob McGrew的带领之下围坐一团。
o1核心贡献者Hyung Won Chung、Noam Brown等关键人物,也都在此列。
随着成员们的踊跃发言,o1的发展历程也逐渐被揭开——受AlphaGo和早期GPT模型的启发,想到了将两张背后的范式结合。
后来,团队训练出了 个可以生成连贯思维链的模型,标志着研究方向开始逐渐明朗和聚焦……
在充满松弛感的气氛当中,众人还分享了有关o1研发的许多趣事:
- 在OpenAI内部,也喜欢用“数r”来 大模型能力
- 为了 “数r”的问题,OpenAI花费了一年半
- 技术人员会把代码报错信息直接丢给o1去debug
- o1曾经说过,生命的意义是“42”,还试图用代数来定义“love”
同时在研究过程中他们还发现,o1不仅比人类更善于发现新的CoT推理步骤,并且还涌现出了自我批评能力。
有网友称赞说,这的确是一个出色的团队, 喜欢听他们的发言,并且模型的能力也确实比以前强。
量子位整理了这次访谈的实录,下面就一起来看~
还没有评论,来说两句吧...