DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM
鞭牛士 2月26日消息,DeepSeek公布开源周第三天的开源项目——DeepGEMM。
据介绍,DeepGEMM是一个支持密集型和混合专家(MoE)通用矩阵乘法(GEMM)运算的 FP8 通用矩阵乘法库,它为V3/R1模型的训练和推理提供支持。
DeepGEMM在英伟达Hopper系列GPU上可实现高达1350以上的FP8每秒万亿次浮点运算(TFLOPS);完全即时编译;核心逻辑代码约300行——但在大多数矩阵规模下,其性能超过了经过专家优化调整的内核;支持密集型布局以及两种混合专家(MoE)布局。
英国报纸集体刊登封面抗议政府可能废除AI版权保护提案
Perplexity推出5000万美元风险基金,支持早期创业公司
阿里云视频生成大模型万相2.1宣布开源
DeepSeek-R2计划提前发布?幻方量化相关人士回应:以官方消息为准

产业招商/厂房土地租售:400 0123 021
或微信/手机:13524678515; 13564686846; 13391219793
请说明您的需求、用途、税收、公司、联系人、手机号,以便快速帮您对接资源。
长按/扫一扫加葛毅明的微信号

扫一扫关注公众号
扫描二维码推送至手机访问。
版权声明:本文由中国产业园区招商网发布,如需转载请注明出处。部份内容收集于网络,如有不妥之处请联系我们删除 13391219793 仅微信