DeepSeek开源第三弹:驱动V3_R1的代码库DeepGEMM
原标题:DeepSeek开源第三弹:驱动V3_R1的代码库DeepGEMM
导读:
北京时间月日凌晨西班牙国王杯第二轮西蒙尼带领的马竞客场逆转第四级别球队卡塞雷尼奥顺利晋级下一轮同时各项赛事连胜延续了最近一个多月的全胜势头月日消息今日的第三天公布了开源第三弹一...
北京时间12月6日凌晨,西班牙国王杯第二轮,西蒙尼带领的马竞客场3-1逆转第四级别球队卡塞雷尼奥,顺利晋级下一轮,同时各项赛事8连胜,延续了最近一个多月的全胜势头。
2月26日消息,今日,OpenSo ceWeek的第三天,DeepSeek公布了开源第三弹——DeepGEMM,一个支持密集型(Dense)和混合专家(MoE)GEMM操作的FP8库,用以驱动V3/R1模型的训练和推理。
据介绍,在Hopper GPU上,DeepGEMM可提供高达1350+ FP8 TFLOPS的计算能力。核心仅约300行,无复杂依赖,运行更加轻便 。同时,支持和两种MoE布局,广泛适用于各种计算需求。在安装时无需预编译,而是通过轻量级的即时编译(JIT)模块。(袁宁)
本文来自 科技报道,更多资讯和深度内容,关注我们。
还没有评论,来说两句吧...