- N +

号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大

号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大原标题:号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大

导读:

为期三天的世界智能网联汽车大会今天日在北京开幕工业和信息化部负责人表示我国智能网联汽车产业发展取得显著成效我国智能网联汽车产业发展取得显著成效工业和信息化部部长金壮龙表示我国已...

为期三天的2024世界智能网联汽车大会今天(17日)在北京开幕。工业和信息化部负责人表示,我国智能网联汽车产业发展取得显著成效。我国智能网联汽车产业发展取得显著成效工业和信息化部部长金壮龙表示,我国已建成了涵盖基础芯片、传感器、计算平台、底盘控制、网联云控在内的完整的智能网联汽车产业化体系。其中,人机交互...

IT之家 2 月 19 日消息,昨天马斯克及其 xAI 团队在直播中正式发布了 Grok 3,此前马斯克通过持续的预热宣传,将外界对 Grok3 的期待值推向了前所未有的高度。马斯克称 Grok 3为,然而其实际表现似乎对不起这个名号。

IT之家注意到,在发布会上,马斯克宣称 Grok 3 在数学、科学与编程的基准 中超越了所有主流模型,并计划将其应用于 S ceX 的计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。

但 Grok3 的实际 表现却让人大跌眼镜。发布后,一些媒体 了 的 Beta 版 Grok 3,并提出了那个经典的用来刁难大模型的问题:“9.11 与 9.9 哪个大?”遗憾的是,号称目前最聪明的 Grok 3,仍然无 确回答这个问题,被网友戏称为“天才不愿意回答简单问题”。

此外,在 xAI 发布会直播中,在分析游戏《流放之路 2》的职业与升华效果时,Grok3 也给出了大量错误 ,并且马斯克也没有看出这些明显的错误。

号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大

尽管在 PPT 中,Grok3 在大模型竞技场 Ch bot Arena 中看似“遥遥领先”,但实际上其与 DeepSeek R1 和 GPT4.0 的 仅为 1% 到 2%。

马斯克在发布会上透露,Grok 3 使用了超过 20 万张 H100 芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3 仅使用 2000 张 H800 芯片训练两个月,其性能却与 Grok 3 相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。

值得一提的是,马斯克在社交媒体上表示,当前的 Grok 3 仅是 版,完整版将在未来几个月推出,并邀请用户反馈使用问题。

返回列表
上一篇:
下一篇:

发表评论中国互联网举报中心

快捷回复:

验证码

    评论列表 (暂无评论,共107人参与)参与讨论

    还没有评论,来说两句吧...