Stargate 计划推进:从宏伟蓝图到务实调整2025 年 1 月,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)、软银集团首席执行官...
2025-07-23 0
IT之家 7 月 11 日消息,科技媒体 NeoWin 昨日(7 月 10 日)发布博文,报道称微软推出 Phi-4-mini-flash-reasoning 小语言模型,重点提升端侧 AI 模型的数学和逻辑推理能力。
Phi-4-mini-flash-reasoning 的主要优势在于,它能够在边缘设备、移动应用和嵌入式系统等资源不足的场景下,引入先进的推理功能。
在架构方面,Phi-4-mini-flash-reasoning 创新引入了 SambaY 架构,而该架构的一大亮点,就是名为 Gated Memory Unit(GMU)的组件,它能够高效地在模型的内部之间共享信息,从而提高模型的效率。
这些改进让模型能够更快地生成答案和完成任务,即使面对非常长的输入也能应对自如,Phi 模型还能处理大量数据,理解非常长的文本或对话。
在性能方面,相比较其它 Phi 模型,Phi-4-mini-flash-reasoning 的吞吐量最高提升 10 倍,这意味着在给定的时间内,Phi-4-mini-flash-reasoning 可以完成更多的工作。
它可以在相同的时间内处理 10 倍多的请求或生成 10 倍多的文本,这对于实际应用来说是一个巨大的改进,此外,延迟也降低至其它 Phi 模型的 1/2~1/3。IT之家附上相关性能数据如下:
Phi-4-mini-flash-reasoning 新型模型已在 Azure AI Foundry、NVIDIA API Catalog 和 Hugging Face 上线。
相关文章
Stargate 计划推进:从宏伟蓝图到务实调整2025 年 1 月,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)、软银集团首席执行官...
2025-07-23 0
续航从下午五点正式开始用,屏幕使用时间去掉充电前半小时,49的电能用3.5小时,耗电场景参考附图,日常续航7小时以上绝对没问题性能性能不用说了,极限肯...
2025-07-23 0
从米15换到Pura70 Pro的第一感受就是——这四曲屏的温润手感真绝了!拇指划过屏幕边缘时那种丝滑的弧度,比直屏机舒服太多。不过续航确实有点绷不住...
2025-07-23 0
博主拆空调测铜管重量的视频一发布,瞬间在网上引起热议。结果一出来,格力铜管的分量直接让那些偷工减料的品牌没脸见人!1 米铜管 55 克的重量远超美的酷...
2025-07-23 0
一个没有985本科文凭、没有家世的普通女孩,如何在竞争如狼似虎的互联网大厂中,扛起巨头京东的半壁江山?她是刘强东的“得力干将”,也是京东“幕后Boss...
2025-07-23 0
DeepSeek是中国一个AI公司推出的聊天工具,性能强,价格低,一下子就火了,可没多久就被好几个国家给屏蔽了。中方直言抗议,说这是拿国家安全当借口,...
2025-07-23 0
快科技7月22日消息,据供应链消息,在W27(6.30-7.6)至W28(7.7-7.13)期间,vivo折叠新品X Fold5首销近两周,国内市场激...
2025-07-23 0
7月17日,首都机场,温度计显示机坪温度接近60℃。进入三伏天,首都机场机坪地表温度更加炽热了。今年是海南航空北京基地地面保障分部站坪保障中心行李分拣...
2025-07-23 0
发表评论