独家对话_ 谁真正低估了Deepseek?
原标题:独家对话_ 谁真正低估了Deepseek?
导读:
新智元导读国内首个自研万卡集群刚刚成功点亮国产的高价门槛直接被打下来了在百度智能云平台上和的*价格直接低至五折和三折基本实现全网最低如何以颠覆性训练...
【新智元导读】国内首个自研万卡集群,刚刚成功点亮!国产AI的高价门槛直接被打下来了。在百度智能云平台上,DeepSeekR1和V3的*价格直接低至五折和三折,基本实现全网最低
DeepSeek如何以颠覆性训练策略重构大型参数模型的成本公式?
1月底,美国知名半导体咨询机构SemiAnalysis发布的一篇主题围绕“给Deepseek算经济账”的文章,一时间成为全球爆款。近日,心智观察所就全球LLM模型竞争生态,如何穿透算力军备竞赛的表象,剖析大模型博弈中数据、算法、资本的三重角力等问题连线了SemiAnalysis。本次对话由心智与SemiAnalysis总裁Dylan P el,资深分析师AJ Ko abi和David Wolfson共同完成。
心智观察所:SemiAnalysis早在去年五月就发现了DeepSeek在MoE、RoPE、Attention等领域的创新贡献,你们是如何敏锐地捕捉到DeepSeek为AI模型带来的突破性?当时行业是否低估了DeepSeek从V2到V3迭代的能力?
SemiAnalysis:我们一直密切关注AI领域的创新和进展,对DeepSeek取得的进步印象深刻。绝大多数领先的AI实验室并没有忽视DeepSeek——Anthropic的CEO公开表示,他们从V2甚至更早的时候就开始跟踪DeepSeek的发展。我们认为,大多数实验室都预计到了从V2到V3会有这种程度的改进,除了Meta。
早在2024年5月,SemiAnalysis就发现了DeepSeek V2相比同行的性价比优势
心智观察所:TCO模型(总计算成本)的搭建是一个 复杂的项目,涉及服务器资本支出(CapEx)、员工工资等。SemiAnalysis是否有特定的计算参数模型,或者是否收到来自相关企业关于计算TCO方法的反馈?
SemiAnalysis:我们开发了自己独有的 方案,并与多家公司合作,提供咨询服务以支持他们的集群建设(注:可参见https://www.semianalysis.com/p/ai-cloud-tco-model)。
心智观察所:根据你们的分析,与OpenAI相比,Meta和Google能够更直接地接触C端消费者。Meta AI是否可能对Google搜索造成不小的冲击?“中国的Google”—— 搜索,是否也会遇到类似的问题?
SemiAnalysis:Meta拥有直 触数十亿日活跃用户的能力,使他们能够立即将大量用户群体调用于他们引入的任何AI功能。
心智观察所:未来DeepSeek将会继续增强其多模态能力,你们如何评估他们与OpenAI(Ch GPT)、Google(Gemini)、Meta(Llama)和Anthropic(Claude)的竞争态势?
SemiAnalysis:我们预计OpenAI在可预见的未来,凭借其在人才、基础设施和资本方面的卓越资源,将保持对DeepSeek的领先地位。DeepSeek正在利用一种新范式,通过瞄准低垂果实实现快速且成本效益高的进展。然而,随着格局的演变,保持这种势头将变得越来越具有挑战性。同样,我们也预计Google将保持领先地位。
在竞争格局内部,Anthropic拥有显著优于DeepSeek的模型,我们预计他们将在不久的将来会公开发布这些模型。另一方面,Meta处于更具挑战性的位置,因为它是 一个致力于开源其模型的主要实验室。据我们了解,他们正在开发一个新模型,预计其性能将超过DeepSeek,但改进的程度是否足以证明推迟发布是合理的,这一点仍不确定。我们在下面这个链接中更详细地探讨了DeepSeek的进展:
https://semianalysis.com/2025/01/31/-deb es/
心智观察所:DeepSeek的崛起促使行业重新考虑Scale Law和“算力”的概念。你认为这将对英伟达H200的销售预期产生什么影响?
SemiAnalysis:DeepSeek推动了AI扩展的创新,证明了战略性优化可以带来有竞争力的结果。他们的进展增 对AI基础设施和计算资源的需求,同时加剧了 实验室之间的竞争,进一步加速了该领域的进展。
心智观察所:推理成本的下降是AI进步的一个标志。从训练到推理,总体而言,像GPT、Gemini和Claude这样的产品如何应对持续降低推理成本的挑战,以及他们如何调整其API定价策略?“杰文斯悖论”是否被过度炒作?
SemiAnalysis:许多 AI实验室正在积极开发针对降低成本的创新,这些AI实验室往往从这些创新中受益最多。当竞争对手提供更低的价格时,供应商不得不通过调整定价来应对。通常,API定价策略会根据市场压力和推动成本下降的内部进展进行调整。然而,在某些情况下,供应商并没有降低价格,而是扩大了对替代性模型的访问——例如OpenAI在DeepSeek取得突破后不久发布了o3-mini。我们认为“杰文斯悖论”并没有被低估,并且我们之前的研究已经广泛覆盖了这个话题。
心智观察所:你如何评估由OpenAI领导的“Starg e”计划?该计划需要动员大量人力和物力资源。这个计划能否与“芯片法案”这样的计划形成联动?
SemiAnalysis:OpenAI的“Starg e”计划与芯片法案完全 ,因为它专注于扩展AI基础设施,而不是对半导体制造端的激励。虽然两者都涉及大量资源动员,但Starg e是一项私有部门的努力,旨在构建先进的AI系统,而芯片法案是一项 计划,旨在提升国内芯片产量。两者之间没有直接联系。
DeepSeek-V3竞争性分析
心智观察所:SemiAnalysis正在吸引越来越多来自中国产业部门的关注,近来几乎每篇文章都会引发广泛讨论。能否谈谈SemiAnalysis在市场研究和行业观察方面是否有一套独特的方 ?能否介绍一下你们团队的规模和盈利模式?
SemiAnalysis:我们的方法并不是什么“秘密配方”——而是对制造业、供应链、技术部署以及AI基础设施战略进行严格研究的结果。这项工作需要一个高度敬业的团队,他们对技术和分析充满热情。随着我们服务的扩展,我们的团队也在不断壮大,从最初的几个人发展到全球约25名分析师,目前分布于北美、欧洲和亚洲等区域。
SemiAnalysis没有“ 办公室”,我们的盈利模式基于销售行业和金融研究。我们的客户范围覆盖从初创公司到全球财富100强公司,技术公司和投资公司各占一半。我们的业务范围包括从简单的新闻通讯订阅到与专门分析师进行为期数月的咨询服务等。
本文系观察者网 稿件,文章内容纯属作者个人观点,不代表 观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guancha ,每日阅读趣味文章。
还没有评论,来说两句吧...