...
2025-08-11 0
在科技行业,华为一直以来都是创新的代名词,其在通信、芯片、云计算等多个领域的成就有目共睹。而近日,一则消息再次让华为成为全球科技界关注的焦点:华为将于 8 月 12 日在 “2025 金融 AI 推理应用落地与发展论坛” 上,发布 AI 推理领域的突破性技术成果。
多方信源透露,这项成果或将对中国 AI 推理生态产生深远影响,尤其是在降低对 HBM(高带宽内存)技术的依赖方面,有望带来实质性的改变。
HBM,作为解决 “数据搬运” 问题的关键技术,在 AI 推理过程中扮演着举足轻重的角色。当 HBM 资源不足时,用户在使用 AI 推理时会明显感受到体验下降,任务卡顿、响应缓慢等问题接踵而至。
目前,全球 HBM 市场主要由 SK 海力士和三星电子主导,二者合计占据了约 90% 的市场份额。据法国约尔情报公司预测,到 2030 年,全球 HBM 销售额有望飙升至约 980 亿美元,约为 2025 年的 3 倍。巨大的市场前景,也让 HBM 领域的竞争愈发激烈。
华为此次即将发布的技术成果,或许能为中国 AI 推理领域带来新的生机。从华为过往的技术创新路径来看,其在 AI 和云计算领域的布局早已展现出前瞻性。
在去年的华为开发者大会(HDC 2024)上,华为云 CTO 张宇昕发布的 EMS 弹性内存存储服务,便是一次针对大模型训练与推理领域 “内存墙” 挑战的成功探索。
EMS 通过在 NPU 卡与持久化存储之间增设弹性内存存储层,并运用 Memory Pooling 专利技术,采用显存扩展、算力卸载和以存代算三大策略,有效突破了内存瓶颈。在大模型推理中,EMS 将模型参数分层存储在显存和 EMS,使得 NPU 部署数量减少 50%;将 KV 相关计算步骤卸载到 EMS,让 AI 推理性能提升了 100%;通过保存历史 KV Cache,推理首 Token 时延降低到 0.2 秒以内,优化了 80%。
而在今年 6 月 20 日举行的华为开发者大会 2025(HDC 2025)上,华为常务董事、华为云计算 CEO 张平安宣布基于 CloudMatrix384 超节点的新一代昇腾 AI 云服务全面上线。该超节点首创将 384 颗昇腾 NPU 和 192 颗鲲鹏 CPU 通过全新高速网络 MatrixLink 全对等互联,形成一台超级 “AI 服务器”,单卡推理吞吐量跃升到 2300 Tokens/s。超节点架构不仅能更好地支持混合专家 MoE 大模型的推理,实现 “一卡一专家”,还可支持 “一卡一算力任务”,将算力有效使用率(MFU)提升 50% 以上。在云数据中心,432 个超节点可级联成最高 16 万卡的超大集群,还支持训推算力一体部署,实现资源最优分配。
基于华为在相关领域的技术积累,此次即将发布的 AI 推理突破性技术成果,极有可能是在上述技术基础上的进一步创新与整合。
有业内人士猜测,华为或许通过优化算法和硬件协同,实现了在低 HBM 配置下的高效 AI 推理,或者开发出了全新的内存管理技术,降低了 AI 推理对 HBM 高带宽的依赖。若真如此,这对于中国 AI 产业而言,无疑是一场及时雨。
从产业影响来看,一方面,华为的这一技术突破有望降低国内企业在 AI 推理领域的成本。长期以来,由于 HBM 技术被国外企业垄断,国内企业在构建 AI 推理平台时,不得不支付高昂的成本购买相关硬件。
若能减少对 HBM 的依赖,企业可以采用更为经济实惠的内存方案,从而降低整体运营成本。另一方面,这也将提升国内 AI 大模型的推理性能。随着推理性能的提升,国内的 AI 大模型在智能客服、智能写作、图像识别等应用场景中,将能够为用户提供更加流畅、高效的服务体验,增强国内 AI 产品在全球市场的竞争力。
此外,华为的技术成果还有望完善中国 AI 推理生态。目前,中国的 AI 推理生态在某些关键环节上仍依赖国外技术,存在一定的供应链风险。华为的新技术若能实现大规模应用,将吸引更多国内企业围绕其进行技术研发和产品创新,形成一个更加自主可控、完整高效的 AI 推理生态体系。
相关文章
8月8日,澎湃新闻从浙江省桐乡市有关部门获悉,此前备受关注的“浙江一老板为女儿举办252桌婚宴花50万嫌贵,怀疑采购商吃回扣拒付款”一事有了新进展。据...
2025-08-11 0
九三阅兵当天,特朗普另有安排,不会来北京观礼了,还好中方提前预料到会出现这种结果,并且留了一手,进退都有足够的腾挪空间。特朗普有什么特殊安排?中方做了...
2025-08-11 0
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-08-11 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-11 0
发表评论