- N +

一线|月之暗面发布推理模型,即将上线数学模型K0-math

一线|月之暗面发布推理模型,即将上线数学模型K0-math原标题:一线|月之暗面发布推理模型,即将上线数学模型K0-math

导读:

随着人工智能和数据中心的用电需求快速释放科技巨头已经将目光转向核能上周谷歌和亚马逊分别与核能企业达成协议并将推进小型模块化反应堆的研发在多种因素推动下市场对核能板块的兴趣也在水...

随着人工智能和数据中心的用电需求快速释放,科技巨头已经将目光转向核能。上周谷歌和亚马逊分别与核能企业达成协议,并将推进小型模块化反应堆(SMR)的研发。在多种因素推动下,市场对核能板块的兴趣也在水涨船高,今年标普500指数成分股中表现最好的公司也来自于该行业。 科技巨头加速入场 强劲的电力需求让科技巨...

腾讯新闻《一线》刘雨点

11月16日,大模型公司月之暗面(Moonshot AI)发布新产品,一款以深度推理为核心功能的数学模型K0-m h。该产品将于近日上线。

月之暗面创始人兼CEO杨植麟在现场介绍称,大模型发生了范式变化,过去是通过next token prediction,但预测下一个词有局限性,是一个静态的数据集,没办法探索更难的任务。接下来大模型的目标是通过reinforcement learning(强化学习)让AI具备思考的能力。“接下来还能持续scale,只是过程不一样。”他称。

杨植麟谈到,什么样的场景最适合让AI锻炼思考能力?他认为是数学场景,这也是前两个月OpenAI发布o1核心想要表达的要点。这样,模型可以自己成为一个体系,不需要和外界交互。同时,强化学习训练出来的模型对于每一步思考更细致,出现跳步比较少,可确保泛化能力。

怎么把强化学习更广泛的使用?把强化学习技术用在搜索场景里面。

他称,上线1年,截至目前,每月超过3600万人在使用Kimi。

据悉,除了深度推理,月之暗面也做探索多模态,深度推理是提高思考能力,思考决定AI的上限;多模态提高交互能力,是必要条件。“思考的重要性远大于交互。”

一线|月之暗面发布推理模型,即将上线数学模型K0-math

另外,杨植麟在回复腾讯新闻《一线》的提问中称,去年说长文本是AGI登月的 步,那么现在深度推理就是登月的第二步。

他认为,现在看,中美在大模型上的 “是一个常数”。 预训练scaling law遇到瓶颈,这对中国大模型团队有可能是一个好事。

对于出海,他称,现在先聚焦,需要耐心一点。

返回列表
上一篇:
下一篇:

发表评论中国互联网举报中心

快捷回复:

验证码

    评论列表 (暂无评论,共36人参与)参与讨论

    还没有评论,来说两句吧...