首页 游戏天地文章正文

瞄准九成数据处理市场,后摩智能发布端边大模型AI芯片

游戏天地 2025年07月27日 00:01 1 admin

7月25日,WAIC 2025前夕,后摩智能发布全新端边大模型AI芯片——后摩漫界®M50,同步推出力擎™系列 M.2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。

瞄准九成数据处理市场,后摩智能发布端边大模型AI芯片

受访者 供图

M50 芯片实现了160TOPS@INT8、100TFLOPS@bFP16 的物理算力,搭配最大48GB内存与153.6 GB/s 的超高带宽,典型功耗仅 10W,相当于手机快充的功率,就能让PC、智能语音设备、机器人等智能移动终端高效运行1.5B 到 70B 参数的本地大模型,实现“高算力、低功耗、即插即用”。

从ChatGPT 到Deepseek,行业已进入“推理密度”与“能耗密度”双重敏感阶段,未来五年推理成本将占大模型全生命周期80%以上。在端边大模型部署“最后一公里”的竞争,或将成为决定未来产业格局的重要拐点。

后摩智能存算一体通过把计算和存储单元集成在一起,让数据就近处理,解决了传统芯片“数据传输慢、功耗高”的问题。M50芯片第二代SRAM-CIM双端口存算架构能让权重加载和矩阵计算同时进行,支持多精度混合运算,可兼顾模型部署的各项需求;后摩智能自主研发的第二代 IPU 架构——天璇,通过压缩自适应计算周期实现弹性计算(Elastic Computing),最高可提供 160% 的加速效果。

除了M50芯片,后摩智能此次发布的产品矩阵形成了覆盖端侧到边缘的多元算力方案。这些产品可广泛应用于消费终端、智能办公、智能工业等多元领域,且均能在离线状态下实现全流程本地处理,从源头杜绝数据联网传输风险。

瞄准九成数据处理市场,后摩智能发布端边大模型AI芯片

受访者 供图

例如在消费终端,赋能笔记本、平板电脑、学习机等设备本地大模型推理能力,无需联网即可完成智能交互、内容生成等任务,用户隐私数据全程闭环留存;智能办公场景中,智能会议系统在断网环境下仍能实现多语种翻译、纪要生成,会议内容不触云、不泄露;智能工业领域,产线质检与车路云协同通过本地算力完成实时分析决策,生产数据与运营信息在设备端闭环处理,避免云端传输隐患。后摩智能通过存算一体技术与大模型的深度融合,推动 AI 大模型在端边侧实现“离线可用、数据留痕不外露”,构建起 “低功耗、高安全、好体验” 的端边智能新生态。

后摩智能创始人、CEO吴强提到,要解决功耗强墙和存储墙难题,就必须走存算一体路线。创业之初公司面临着英伟达这样的国际巨头,就要另辟蹊径、要有比较创新的架构,于是选择了当时看起来冷门的“存算一体”技术路线,并为此耕耘了四年多。

他说,未来大模型有两个重要发展趋势:一是重心逐渐从训练向推理迁移,比如需要更多的芯片;二是逐渐从云端智能逐渐向边端或者端边智能迁移。未来的计算格局有可能是端、边、云的混合体。但90%的数据处理可能会在端和边,只有10%的训练算到云端做更昂贵或者更复杂的任务。

【对话】

南方+:存算一体的核心技术壁垒是什么?其他类似的竞品会加入到竞争吗?

吴强:其实很多人包括一些上市公司或者即将上市公司,都在说下一代的技术布局是“存算一体”,认识到存算一体是做AI大模型的优势。

我们有先发优势。在学术界看到的文章只是理论层面,怎么将理论转化为实际,怎么变成量产,我们四年一路蹚过很多坑。如果友商一起做,我们也非常欢迎,一起把生态做好。但是他们一定会经过我们走过的坑,包括大电流怎么处理,因为那么小的芯片熬密度很高,这些都必然考虑;知道芯片内核是怎么把存算用起来,除了硬件设计也包含一堆量产工程。

其实我们第一代做的并不好,第一代编译器用传统方案,很多功能发挥不出来,中间重构了一遍,完全从“0-1”逐渐摸索。任何一个友商也很难避开这些坑。

南方+:今年AI技术方面趋势变化很快,特别是像Agent、世界模型都在不断迭代,对你们有怎样的影响?

吴强:Agent主要还是在应用层,我们关注的是底层模型层面能不能适配得好。这也是我们团队为什么一直在写文章,是奔着最新的东西,比如mamba,非transformer的架构会带来怎样的影响。

南方+:很多信创产品软硬件结合一起不太好用,特别是涉及生态迁移问题,后摩智能是否也有类似的问题?

吴强:信创是一个重要的机会,而一大抱怨的确是不好用,买了以后没有人用。我们想把它变成AI、变得好用。我们一个重要应用是在公文写作,因为信创主要瞄准政企市场,公文写作是必须要的,我们做的信创版本,包括会议纪要整理、知识问答,在信创领域的需求是最大的,政务写作会有很多。这需要应用层包括OS层,以及作为芯片层一起努力,把它变得好用。

南方+:地平线提到,面向物联网领域一大挑战在于场景碎片化,很难支撑起量,于是后来聚焦在汽车,赶上了新能源风口。怎么看待物联网场景碎片化的情况?

吴强:前几年,物联网面向AIoT安防领域确实比较碎片化,但在当下,有一些新兴的、大的赛道还是值得我们关注,地平线旗下还有地瓜,拆分子公司去做具身机器人或者陪伴机器人领域的芯片。端边有很多新兴市场,这是一个很大的垂直赛道,具身机器人并不碎片化。

南方+记者 郜小平

【作者】 郜小平

【来源】 南方报业传媒集团南方+客户端

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动