8月21日,DeepSeek表示最新的V3.1版本使用了UE8M0 FP8 Scale参数精度,同时在留言里透露,UE8M0 FP8是针对即将发布的下一代国产芯片设计。
资料显示,FP8是当前AI计算的一种前沿低精度格式,在支持原生FP8的GPU上,大语言模型训练采用FP8混合精度可大幅提高GPU算力,显著降低显存占用,在2022年首次被英伟达、Arm和英特尔联合提出,
对于AI芯片,上海证券认为,国产GPU虽然还未到对标国外产品的水平,但已经能够满足部分对算力有一定要求的应用场景,目前国产GPU进入了快速发展阶段,将从“可用”阶段进入“好用”阶段。
除了寒武纪、海光信息以及华为等厂商,华鑫证券表示,其他国产AI芯片厂商也呈现加速渗透的态势。如摩尔线程能够提供AI训练智算卡、AI推理卡及夸娥(KUAE)智算集群等。其最新一代GPU采用“平湖”架构,增加了FP8精度支持,大幅提升AI算力,能够全面支撑面向DeepSeek类前沿大模型预训练的万卡集群智算中心解决方案。
另外沐曦能够提供训推一体的C系列GPU,该GPU具有强大的大规模并行计算能力,已在多个智算中心中获得规模化应用。此外,沐曦还能提供智算推理为主的N系列GPU,主要面向生成式人工智能下的云端人工智能推理场景,拥有强大的多精度混合算力。
根据弗若斯特沙利文预测,全球GPU市场规模预计在2029年将达到36119.74亿元,其中,中国GPU市场规模在2029年将达到13635.78亿元,在全球市场中的市场占比预计将从2024年的30.8%提升至2029年的37.8%。
另外国金证券表示,Deepseek带动AI应用从集中式云服务向海量终端扩散,需要高性价比的专用芯片支撑,目前国内各大芯片厂商、应用端企业正在加速对接DeepSeek。同时在禁令加剧以及国内以字节为首的互联网厂商大规模建设算力的背景下,预计2025年国产算力将大规模起量。
公司方面,据中金公司等表示,
此外,据官微介绍,本次升级后将支持混合推理架构,拥有更高的思考效率和更强的Agent能力。通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
*免责声明:文章内容仅供参考,不构成投资建议
*风险提示:股市有风险,入市需谨慎