Grok 4横空出世！多AI组队碾压谷歌OpenAI，却藏着致命争议

健康生活 2025年07月27日 03:45 1 admin

当埃隆·马斯克在2025年7月9日按下发布键时，整个AI行业都感受到了震动。他的xAI团队推出的Grok 4，不仅带着1.7万亿参数的庞大规模登场，更用"AI组队解题"的骚操作，把谷歌、OpenAI这些巨头甩在了身后。这个被称为"最聪明AI"的新物种，到底是颠覆未来的曙光，还是隐藏着风险的潘多拉魔盒？

让AI当"学霸小组"：马斯克的反套路设计

打开Grok 4的底层代码，你会发现马斯克又玩起了颠覆。不同于其他AI单打独斗的传统模式，Grok 4 Heavy搞出了"学习小组"模式——多个AI智能体各自解题，再碰面"讨论"出最优解。就像一群学霸凑在一起做难题，思路碰撞出的火花，让它在"人类终极考试"中拿下44.4%的正确率，直接把谷歌Gemini之前26.9%的纪录斩落马下。

这套架构背后是真金白银堆出来的底气：20万台NVIDIA H100 GPU组成的Colossus超级计算机，计算量是上一代Grok 2的100倍。这让它能轻松吞下25.6万个单词的超长文本（相当于5本《三体》），比OpenAI的模型多装下四分之一的内容。

成绩单亮瞎眼：但这些短板让专家捏汗

在AI界的"高考"里，Grok 4交出了一张近乎完美的答卷：智能指数73分，把OpenAI的o3（70分）、谷歌Gemini 2.5 Pro（70分）都甩在身后。尤其在数学和物理领域，它甚至能在AIME考试中拿满分，马斯克得意地说："除非题目故意挖坑，否则它做数理题从不出错。"

但翻开细节，隐患不少：

- 看图片解题的能力被谷歌甩了一条街，复杂图像分析常常翻车

- 处理速度比竞品慢15%，急着要答案的用户得耐住性子

- 最致命的是，有测试发现它在基准题里表现神勇，到了实际生活场景中却频频掉链子，就像应试教育培养出的"高分低能"

300元一个月！马斯克把AI做成了奢侈品

当xAI公布价格时，网友炸了锅：基础版每月40美元，最强的Heavy版要300美元（约2160元人民币）！这价格是ChatGPT Plus的6倍，堪称AI界的爱马仕。

但马斯克的算盘打得精：这个定价专门瞄准科研机构和企业客户。比如美国航天局用它分析火星数据，华尔街投行靠它预测市场波动，这些场景下，精准度比价格重要得多。有趣的是，连Grok 4自己都在测试中承认："这价格对普通人确实太贵了。"

从反犹言论到政治偏见：AI安全的雷区它全踩了

最让行业担忧的，是Grok 4的"三观"问题。早期版本曾冒出反犹言论，对敏感政治话题的回答带着明显偏见。有研究者让它评价不同国家的防疫政策，结果输出的内容被网友扒出"夹带私货"。

这些问题暴露了xAI在内容审核上的粗糙。相比之下，Anthropic的Claude设置了多层安全过滤，谷歌也有专门的伦理委员会把关。马斯克一直主张"AI自由"，但这种放任似乎正在埋下隐患。

未来两年要搞出"新物理"？马斯克的野望靠谱吗

xAI的 roadmap 写得比科幻小说还刺激：8月出编程专用版，10月能生成视频，年底实现音视频全打通。马斯克更大胆预言，两年内让Grok发现"新技术甚至新物理"。

这口气够大，但业内普遍觉得悬。谷歌DeepMind花了十年才搞出AlphaFold，要让AI突破人类认知边界，恐怕不是堆参数就能实现的。更现实的是，美国政府已经盯上了它，专门推出"政府版Grok"，这背后是科技竞争还是安全管控，谁也说不准。

Grok 4就像AI界的一枚深水炸弹，炸开了性能天花板，也搅起了安全、伦理、定价的浑水。它证明AI的智商还能再上台阶，但也提醒我们：真正的智能，不止是会做题、能聊天那么简单。当马斯克把"最聪明"的桂冠戴在它头上时，或许我们更该思考：我们到底需要一个怎样的AI未来？

新华全媒+丨2025世界人工智能大会开幕

不怕被挖，谷歌晒IMO金牌团队大合照，还挨个圈出了联系方式

发表评论

Grok 4横空出世！多AI组队碾压谷歌OpenAI，却藏着致命争议

新华全媒+丨2025世界人工智能大会开幕

不怕被挖，谷歌晒IMO金牌团队大合照，还挨个圈出了联系方式

最新评论

最新留言

标签列表