即时新闻

news
首页 > 即时新闻 > 正文内容

中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地

小小1周前 (02-16)即时新闻10

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈

  DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成本的极致优化,也为端侧部署高性能模型提供新的方向。本篇报告我们通过分析DeepSeek V3和R1模型论文,理解其核心逻辑是“按需分配算力,最小化冗余计算”,使得千亿级模型在低成本硬件(甚至边缘设备)上高效运行成为可能,为大规模商业化落地提供了技术基础。我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:建议核心关注晶圆代工、国产算力芯片、定制化存储、终端品牌、SoC五大方向。

  ▍DeepSeek如何实现的训练成本降低?

  1)架构创新: DeepSeek-V3的基础架构中采用了DeepSeekMoE专家架构和MLA多头潜在注意力机制,DeepSeekMoE通过细粒度专家分配、共享专家及无辅助损失负载均衡策略优化传统MoE,提升计算资源效率;MLA通过低秩联合压缩减少注意力键值缓存占用,提升计算效率、减少内存消耗。

  2)FP8混合精度训练:在全球主流大模型中率先采用FP8低精度数据进行大规模训练,大部分核心计算用FP8提升速度、降低内存用量,部分关键操作保留高精度确保动态稳定性。

  3)训练工程优化:DeepSeek在主流大模型中率先采用硬盘充当输入端缓存,设计DualPipe算法实现高效流水线并行,融合前后向通信阶段,减少阻塞;采用定制化高效跨节点all-to-all通信内核降低通信开销;通过重计算、EMA、共享向量和输出头减少内存占用。

  4)数据策略优化:应用多token预测机制MTP,增加训练信号密度,减少20%训练迭代次数,帮助模型捕捉长距离依赖关系。

  ▍DeepSeek如何实现的推理成本降低?

  DeepSeek-V3对推理的预填充和解码两个阶段都优化了专家使用效率:预填充阶段MoE用EP32及冗余专家策略提升效率,解码阶段探索动态路由减少通信开销;还通过支持FP8、INT8量化和提供蒸馏版本,实现低精度量化与模型压缩,减少显存占用。DeepSeek的开源生态可以更好支持硬件厂商适配,例如可以对MLA算子优化提升推理效率,DeepSeek-R1发布后国内外芯片厂商快速响应支持DeepSeek。1月25日,AMD宣布已将新的DeepSeek-V3集成到Instinct MI300X GPU上并经过SGLang对推理过程进行了优化,英伟达、英特尔也随后在1月31日官宣支持。国内厂商都已经官宣完成对DeepSeek的适配,国产算力成为相对稳定可靠的选项,支撑国产大模型从研发走向商业化。

  ▍从DeepSeek算力需求看AI芯片设计方向?

  DeepSeek 在论文的芯片设计意见指导中指出通信和计算同等重要,计算方面降低精度和内存需求是关键。在通信硬件优化上,DeepSeek建议开发独立通信协处理器,实现计算与通信物理分离,同时建议融合网络架构,统一IB和 NVLink的网络协议栈,统一通信接口以简化编程复杂度和降低通信延迟;在计算硬件优化上,建议提升 FP8 计算精度,并支持分块量化与在线量化,减少访存开销,提升推理效率。我们认为DeepSeek建议带来两点启示:

  1)“推理速度”基本90%是由decoding阶段决定的,因此内存容量决定大模型推理速度,我们认为内存升级仍是算力芯片升级的重点方向,看好近存计算发展。

  2)我们认为在模型开源的策略下,DeepSeek-R1蒸馏后的小模型性能有望持续快速提升,帮助端侧硬件加速接入,助力AI应用全面落地。我们看好品牌商和SoC芯片厂商的成长机遇。

  ▍风险因素:

  算力芯片供应链风险;芯片产能供给不足的风险;互联网大厂资本开支不及预期;相关产业政策出台力度不及预期;AI技术及应用发展不及预期;芯片技术迭代不及预期;国产先进制程量产进展不及预期;行业竞争加剧等。

  ▍投资策略:

  我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:

  1)云端:DeepSeek有望开启全新的Scaling Law,模型重心逐步从预训练切换到强化学习、推理阶段,助力算力需求持续增长。

  2)终端:我们看好DeepSeek带来模型轻量化的全面升级,端侧硬件接入有望加速爆发,助力AI应用全面落地,建议关注品牌厂商,SoC芯片厂商。

扫描二维码推送至手机访问。

版权声明:本文由啛啛喳喳发布,如需转载请注明出处。

转载请注明出处http://m.gdhtwj.com/post/129.html

分享给朋友:

相关文章

美媒:特朗普称原计划4月1日愚人节对进口汽车征税,但因“迷信”推迟

美媒:特朗普称原计划4月1日愚人节对进口汽车征税,但因“迷信”推迟

  来源:环球网   【环球网报道 记者 姜蔼玲】据美国《纽约时报》等外媒报道,美国总统特朗普当地时间14日宣布,他计划在4月2日左右对进口汽车征收关税。特朗普没有透露具体细节,也未说明哪些国家可能成...

光明地产:光明地产第九届董事会第二十六次会议决议公告

光明地产:光明地产第九届董事会第二十六次会议决议公告...

安妮股份(002235) 、太安堂(002433)投资者索赔案持续推进

安妮股份(002235) 、太安堂(002433)投资者索赔案持续推进

  上海久诚律师事务所许峰律师提示,安妮股份(维权)(002235)、 太安堂(002433)虚假陈述引发的投资者索赔案均还在持续推进,符合条件的投资者可保持关注   许峰律师代理的安妮股份投资者索赔...

超图软件:公司低空经济业务方面目前已形成合同收入

超图软件:公司低空经济业务方面目前已形成合同收入

快讯摘要 【超图软件:公司低空经济业务方面目前已形成合同收入】讯,超图软件(300036)2月14日接受机构调研...

必创科技:副总经理张志涛计划减持公司股份不超过约16万股

必创科技:副总经理张志涛计划减持公司股份不超过约16万股

快讯摘要 必创科技:副总经理张志涛计划减持公司股份不超过约16万股 每经AI快讯,必创科技(SZ300667,收...

宁德时代赴港上市有何玄机?

  来源:中国经营报   本报记者 陈靖斌 广州报道   2月11日,宁德时代(300750.SZ)正式向香港联交所递交发行境外上市外资股(H股)并在香港联交所主板挂牌上市的申请。然而,值得注意的是,...

现在,非常期待与您的又一次邂逅

我们努力让每一次邂逅总能超越期待

  • 开源程序
    开源程序

    既是博客,也是CMS建站系统

  • 性能稳定
    性能稳定

    响应速度快,放心有保障

  • 用户体验
    用户体验

    响应式布局,兼容各种设备

  • 持续更新
    持续更新

    不断升级维护,更好服务用户