世界杯体育使RL后历练干与超节点集群时期-开云·Kaiyun(中国)官方网站-科技股份有限公司

开云·Kaiyun(中国)官方网站-科技股份有限公司

开云·Kaiyun(中国)官方网站-科技股份有限公司

  • 首页
  • 资讯
  • 娱乐
  • 新闻
  • 旅游
  • 汽车
  • 电影
  • 你的位置:开云·Kaiyun(中国)官方网站-科技股份有限公司 > 新闻 > 世界杯体育使RL后历练干与超节点集群时期-开云·Kaiyun(中国)官方网站-科技股份有限公司

    世界杯体育使RL后历练干与超节点集群时期-开云·Kaiyun(中国)官方网站-科技股份有限公司

    发布日期:2026-06-13 08:54    点击次数:140

      近日,华为在MoE模子历练边界再进一步,重磅推出参数限制高达7180亿的全新模子——盘古Ultra MoE,这是一个全进程在昇腾AI推测平台上历练的准万亿MoE模子。华为同期发布盘古Ultra MoE模子架构和历练步履的本事申报,清晰繁密本事细节,充分体现了昇腾在超大限制MoE历练性能上的逾越。

      历练超大限制和极高疏淡性的 MoE 模子极具挑战,历练过程中的明白性不绝难以保险。针对这一贫窭,盘古团队在模子架构和历练步履上进行了改进性谋划,得手地在昇腾平台上收尾了准万亿 MoE 模子的全进程历练。

      在模子架构上,盘古团队建议Depth-Scaled Sandwich-Norm(DSSN)明白架构和TinyInit小脱手化的步履,在昇腾平台上收尾了卓越18TB数据的恒久明白历练。此外,他们还建议了 EP loss 负载优化步履,这一谋划不仅保证了各个行家之间较好的负载平衡,也普及了行家的边界特化能力。同期,盘古Ultra MoE使用了业界先进的MLA和MTP架构,在预历练和后历练阶段齐使用了Dropless历练计谋,收尾了超大限制MoE架构在模子后果与遵循之间的最好平衡。

      在历练步履上,华为团队初度清晰在昇腾CloudMatrix 384超节点上,高效买通大疏淡比MoE强化学习(RL)后历练框架的关节本事,使RL后历练干与超节点集群时期。同期,在5月初发布的预历练系统加快本事基础上,在不到一个月的期间内,华为团队又完成了一轮迭代升级,包括:适配昇腾硬件的自相宜活水粉饰计谋,进一步优化算子推论序,进一步裁减Host-Bound以及普及EP通讯的粉饰;自相宜科罚内存优化计谋的建造;数据重排收尾DP间Attention负载平衡;以及昇腾亲和的算子优化,这些本事收尾万卡集群预历练MFU由30%大幅普及至41%。

      此外,近期发布的盘古Pro MoE大模子,在参数目仅为720亿,激活160亿参数目的情况下,通过动态激活行家集合的改进谋划,收尾了以小打大的优异性能,致使不错忘形千亿级模子的性能发扬。在业界泰斗大模子榜单SuperCLUE最新公布的2025年5月名次榜上,位居千亿参数目以内大模子名次并各国内第一。

      华为盘古Ultra MoE和盘古Pro MoE系列模子的发布,解说华为不仅完成了国产算力+国产模子的全进程自主可控的历练本质世界杯体育,同期在集群历练系统的性能上也收尾了业界最初。这意味着国产AI基础法子的自主改进能力得回了进一步考证,为中国东谈主工智能产业的发展提供了一颗“安定丸”。



    栏目分类