智东西8月21日消息,昨天,“好望角科学沙龙”中英科技成果转化专场活动在上海举行,来自牛津大学、帝国理工学院、伦敦政治经济学院等英国高校20余名青年学...
2025-08-21 0
2025年8月10日科技领域的最新资讯动态汇总
文/低空经济探索者
一、华为即将发布AI推理突破性成果,剑指HBM依赖难题
1. 技术核心
华为宣布将于8月12日在“2025金融AI推理应用落地与发展论坛”上发布AI推理领域的突破性技术。该成果旨在降低对HBM(高带宽内存)的依赖,提升国产AI大模型的推理性能,完善中国AI推理生态。当前HBM是解决AI“数据搬运”瓶颈的关键,其供应受国际垄断且价格暴涨(HBM3芯片现货价2025年初同比涨300%)。
2. 国产替代意义
技术自主:HBM市场被SK海力士(53%)、三星(38%)、美光(10%)垄断,国内长鑫存储正加速布局。
性能优化:HBM短缺会导致AI推理响应延迟,华为技术或通过算法优化或异构计算架构(如昇腾CANN)缓解此问题。
金融领域应用:华为将联合中国银联发布金融场景AI推理应用成果,推动技术规模化落地。
二、华为昇腾AI推理性能已有突破性进展
DeepSeek全栈方案:2025年3月,华为与北京大学合作推出基于昇腾的DeepSeek开源推理方案,整合SCOW算力平台、MindSpore等组件,实现高效推理。
关键性能指标:
CloudMatrix 384:50ms延迟下单卡吞吐达1920 Tokens/s(DeepSeek V3/R1模型)。
Atlas 800I A2服务器:100ms延迟下单卡吞吐808 Tokens/s。
MoE模型突破:与科大讯飞合作实现国产算力上专家并行集群推理,吞吐提升3.2倍,时延降低50%。
CloudMatrix 384超节点50ms1920 Tokens/sDeepSeek V3/R1超节点部署,高效解码
Atlas 800I A2服务器100ms 808 Tokens/s 通用大模型单卡高性能推理
MoE专家并行集群大幅降低提升3.2倍 MoE大模型跨节点专家并行
三、AI推理市场趋势:从训练到应用落地
需求转向:IDC预测,2027年AI工作负载中推理占比将达72.6%(当前训练占主导)。
产业驱动:英伟达2024财年数据中心收入40%来自推理业务,反映市场重心向应用端迁移。
国产化路径:华为通过“非摩尔定律路径”(如数学优化、群计算)弥补单芯片差距,推动国产算力生态。
四、金融AI推理论坛前瞻
8月12日的论坛将汇集华为、中国银联、信通院、清华大学及科大讯飞专家,重点探讨:
大模型推理加速与体验优化实践;
AI推理在金融风控、智能客服等场景的规模化应用;
降低HBM依赖的技术路径对金融业成本的影响。
总结
今日科技头条聚焦华为突破AI推理技术瓶颈,直指国产化痛点。若其成果如期落地,将重塑国内AI算力生态,推动金融等垂直领域应用爆发。同时,HBM替代技术、昇腾硬件性能及推理市场占比攀升,标志AI产业正式进入“应用价值最大化”阶段。
相关文章
智东西8月21日消息,昨天,“好望角科学沙龙”中英科技成果转化专场活动在上海举行,来自牛津大学、帝国理工学院、伦敦政治经济学院等英国高校20余名青年学...
2025-08-21 0
微软近日公告,计划停止企业购买Microsoft 365生产力软件订阅和其他云软件产品线时的折扣,或致价格涨10%以上。瑞银分析师称涨价或已计入业绩指...
2025-08-21 0
钛媒体App 8月21日消息,飞猪AI旅行助手“问一问”功能更新,可在为用户发现或挑选目的地时,提供旅行热力地图,查看目的地的客流热度,帮助用户更合理...
2025-08-21 0
金融界2025年8月21日消息,国家知识产权局信息显示,苏州博理新材料科技有限公司取得一项名为“磁力清洗机”的专利,授权公告号CN223236989U...
2025-08-21 0
9月,北京市将在16个区和经开区,组织开展包括第十五届北京科学嘉年华、京津冀公民科学素质大赛、北京社会科学普及周等在内的近3000场次的科普活动。8月...
2025-08-21 0
北京商报讯(记者 陶凤 实习记者 王天逸)8月21日,海尔集团董事局主席、首席执行官周云杰在其个人微博宣布:8月26日将举办“海尔兄弟”新老朋友见面会...
2025-08-21 0
魅族不是倒闭了吗,怎么还在发手机?这或许就是大多数网友们对现在魅族的第一印象了!毕竟相较于现在一年就发布N款新机的机圈友商们,魅族从巅峰期2200万的...
2025-08-21 0
老板没变,似乎仍停留在那个崇尚所谓“硬核奋斗”的旧周期里。但员工变了,他们再也不是任劳任怨、沉默的“牛马”。内容/刘平编辑/咏鹅校对/莽夫钉钉又有员工...
2025-08-21 0
发表评论