星空君最近接了个大活,把几个用了N年的系统进行信创化改造。信创的概念提了十几年了,但一直没有非常清晰的标准,最近两年突然标准清晰了,让星空君有点措手不...
2025-07-27 0
当埃隆·马斯克在2025年7月9日按下发布键时,整个AI行业都感受到了震动。他的xAI团队推出的Grok 4,不仅带着1.7万亿参数的庞大规模登场,更用"AI组队解题"的骚操作,把谷歌、OpenAI这些巨头甩在了身后。这个被称为"最聪明AI"的新物种,到底是颠覆未来的曙光,还是隐藏着风险的潘多拉魔盒?
让AI当"学霸小组":马斯克的反套路设计
打开Grok 4的底层代码,你会发现马斯克又玩起了颠覆。不同于其他AI单打独斗的传统模式,Grok 4 Heavy搞出了"学习小组"模式——多个AI智能体各自解题,再碰面"讨论"出最优解。就像一群学霸凑在一起做难题,思路碰撞出的火花,让它在"人类终极考试"中拿下44.4%的正确率,直接把谷歌Gemini之前26.9%的纪录斩落马下。
这套架构背后是真金白银堆出来的底气:20万台NVIDIA H100 GPU组成的Colossus超级计算机,计算量是上一代Grok 2的100倍。这让它能轻松吞下25.6万个单词的超长文本(相当于5本《三体》),比OpenAI的模型多装下四分之一的内容。
成绩单亮瞎眼:但这些短板让专家捏汗
在AI界的"高考"里,Grok 4交出了一张近乎完美的答卷:智能指数73分,把OpenAI的o3(70分)、谷歌Gemini 2.5 Pro(70分)都甩在身后。尤其在数学和物理领域,它甚至能在AIME考试中拿满分,马斯克得意地说:"除非题目故意挖坑,否则它做数理题从不出错。"
但翻开细节,隐患不少:
- 看图片解题的能力被谷歌甩了一条街,复杂图像分析常常翻车
- 处理速度比竞品慢15%,急着要答案的用户得耐住性子
- 最致命的是,有测试发现它在基准题里表现神勇,到了实际生活场景中却频频掉链子,就像应试教育培养出的"高分低能"
300元一个月!马斯克把AI做成了奢侈品
当xAI公布价格时,网友炸了锅:基础版每月40美元,最强的Heavy版要300美元(约2160元人民币)!这价格是ChatGPT Plus的6倍,堪称AI界的爱马仕。
但马斯克的算盘打得精:这个定价专门瞄准科研机构和企业客户。比如美国航天局用它分析火星数据,华尔街投行靠它预测市场波动,这些场景下,精准度比价格重要得多。有趣的是,连Grok 4自己都在测试中承认:"这价格对普通人确实太贵了。"
从反犹言论到政治偏见:AI安全的雷区它全踩了
最让行业担忧的,是Grok 4的"三观"问题。早期版本曾冒出反犹言论,对敏感政治话题的回答带着明显偏见。有研究者让它评价不同国家的防疫政策,结果输出的内容被网友扒出"夹带私货"。
这些问题暴露了xAI在内容审核上的粗糙。相比之下,Anthropic的Claude设置了多层安全过滤,谷歌也有专门的伦理委员会把关。马斯克一直主张"AI自由",但这种放任似乎正在埋下隐患。
未来两年要搞出"新物理"?马斯克的野望靠谱吗
xAI的 roadmap 写得比科幻小说还刺激:8月出编程专用版,10月能生成视频,年底实现音视频全打通。马斯克更大胆预言,两年内让Grok发现"新技术甚至新物理"。
这口气够大,但业内普遍觉得悬。谷歌DeepMind花了十年才搞出AlphaFold,要让AI突破人类认知边界,恐怕不是堆参数就能实现的。更现实的是,美国政府已经盯上了它,专门推出"政府版Grok",这背后是科技竞争还是安全管控,谁也说不准。
Grok 4就像AI界的一枚深水炸弹,炸开了性能天花板,也搅起了安全、伦理、定价的浑水。它证明AI的智商还能再上台阶,但也提醒我们:真正的智能,不止是会做题、能聊天那么简单。当马斯克把"最聪明"的桂冠戴在它头上时,或许我们更该思考:我们到底需要一个怎样的AI未来?
相关文章
星空君最近接了个大活,把几个用了N年的系统进行信创化改造。信创的概念提了十几年了,但一直没有非常清晰的标准,最近两年突然标准清晰了,让星空君有点措手不...
2025-07-27 0
本内容来源于@什么值得买APP,观点仅代表作者本人 |作者:特务凸前言现在人手都是多个设备,手机、平板、笔记本电脑等等,甚至有些玩家还是多台手机,最关...
2025-07-27 0
【上海浦东:未来三年新增1000家人工智能企业 将推出全国首个“异构人形机器人训练场”】财联社7月27日电,今日召开的2025浦东新区人工智能产业生态...
2025-07-27 0
#上头条 聊热点##精彩V视#雅江水电站规格之高,投资之巨雅江水电站的投资是1.2万亿,换算成印度卢比,是14.47万亿。相当于印度2025财年总GD...
2025-07-27 0
2025年快要过半了!作为开放式耳机发展的当打之年,已经有许多的厂商推出了自家的新款!旗舰机型更是数不胜数,但是也有很多产品在其中滥竽充数,专门迷糊那...
2025-07-27 0
当马斯克还在美国奥斯汀忙着给特斯拉Robotaxi(无人驾驶出租车)扩大测试区域时,来自中国的Robotaxi已经开始当起重磅大会的主要交通工具之一了...
2025-07-27 0
前言:想搭配一套主流的台式电脑前,那么首先必须是了解自己对于性能需求为前提,以更合理的价格购买到相应的硬件配置,这可以避免搭配后性能过剩,又可以节省出...
2025-07-27 0
金融界2025年7月26日消息,国家知识产权局信息显示,广州广有通信设备有限公司申请一项名为“一种目标检测模型的训练方法、检测方法及系统”的专利,公开...
2025-07-27 0
发表评论