首页 健康生活文章正文

Grok 4横空出世!多AI组队碾压谷歌OpenAI,却藏着致命争议

健康生活 2025年07月27日 03:45 1 admin


Grok 4横空出世!多AI组队碾压谷歌OpenAI,却藏着致命争议

当埃隆·马斯克在2025年7月9日按下发布键时,整个AI行业都感受到了震动。他的xAI团队推出的Grok 4,不仅带着1.7万亿参数的庞大规模登场,更用"AI组队解题"的骚操作,把谷歌、OpenAI这些巨头甩在了身后。这个被称为"最聪明AI"的新物种,到底是颠覆未来的曙光,还是隐藏着风险的潘多拉魔盒?


让AI当"学霸小组":马斯克的反套路设计


打开Grok 4的底层代码,你会发现马斯克又玩起了颠覆。不同于其他AI单打独斗的传统模式,Grok 4 Heavy搞出了"学习小组"模式——多个AI智能体各自解题,再碰面"讨论"出最优解。就像一群学霸凑在一起做难题,思路碰撞出的火花,让它在"人类终极考试"中拿下44.4%的正确率,直接把谷歌Gemini之前26.9%的纪录斩落马下。


这套架构背后是真金白银堆出来的底气:20万台NVIDIA H100 GPU组成的Colossus超级计算机,计算量是上一代Grok 2的100倍。这让它能轻松吞下25.6万个单词的超长文本(相当于5本《三体》),比OpenAI的模型多装下四分之一的内容。


成绩单亮瞎眼:但这些短板让专家捏汗


在AI界的"高考"里,Grok 4交出了一张近乎完美的答卷:智能指数73分,把OpenAI的o3(70分)、谷歌Gemini 2.5 Pro(70分)都甩在身后。尤其在数学和物理领域,它甚至能在AIME考试中拿满分,马斯克得意地说:"除非题目故意挖坑,否则它做数理题从不出错。"


但翻开细节,隐患不少:


- 看图片解题的能力被谷歌甩了一条街,复杂图像分析常常翻车

- 处理速度比竞品慢15%,急着要答案的用户得耐住性子

- 最致命的是,有测试发现它在基准题里表现神勇,到了实际生活场景中却频频掉链子,就像应试教育培养出的"高分低能"


300元一个月!马斯克把AI做成了奢侈品


当xAI公布价格时,网友炸了锅:基础版每月40美元,最强的Heavy版要300美元(约2160元人民币)!这价格是ChatGPT Plus的6倍,堪称AI界的爱马仕。


但马斯克的算盘打得精:这个定价专门瞄准科研机构和企业客户。比如美国航天局用它分析火星数据,华尔街投行靠它预测市场波动,这些场景下,精准度比价格重要得多。有趣的是,连Grok 4自己都在测试中承认:"这价格对普通人确实太贵了。"


从反犹言论到政治偏见:AI安全的雷区它全踩了


最让行业担忧的,是Grok 4的"三观"问题。早期版本曾冒出反犹言论,对敏感政治话题的回答带着明显偏见。有研究者让它评价不同国家的防疫政策,结果输出的内容被网友扒出"夹带私货"。


这些问题暴露了xAI在内容审核上的粗糙。相比之下,Anthropic的Claude设置了多层安全过滤,谷歌也有专门的伦理委员会把关。马斯克一直主张"AI自由",但这种放任似乎正在埋下隐患。


未来两年要搞出"新物理"?马斯克的野望靠谱吗


xAI的 roadmap 写得比科幻小说还刺激:8月出编程专用版,10月能生成视频,年底实现音视频全打通。马斯克更大胆预言,两年内让Grok发现"新技术甚至新物理"。


这口气够大,但业内普遍觉得悬。谷歌DeepMind花了十年才搞出AlphaFold,要让AI突破人类认知边界,恐怕不是堆参数就能实现的。更现实的是,美国政府已经盯上了它,专门推出"政府版Grok",这背后是科技竞争还是安全管控,谁也说不准。


Grok 4就像AI界的一枚深水炸弹,炸开了性能天花板,也搅起了安全、伦理、定价的浑水。它证明AI的智商还能再上台阶,但也提醒我们:真正的智能,不止是会做题、能聊天那么简单。当马斯克把"最聪明"的桂冠戴在它头上时,或许我们更该思考:我们到底需要一个怎样的AI未来?

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动