您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-11 0
近期OpenAI发布GPT-5,引发资本市场关注。该模型推理能力进步明显,不仅在通用场景测试中得分较前代旗舰模型o3提升明显,而且在幻觉测试中错误率最低降低至0.7%;定价与Gemini 2.5 Pro等主流模型持平,性价比显著提升。而在垂类场景如编程和医疗上,GPT-5亦有不错的测评表现,展现出良好的场景拓展潜力。我们认为OpenAI等模型厂商近期的快速更新迭代的影响包括:科技巨头在前沿模型领域的军备竞赛、推理&scaling law&多模态等带来的算力持续爆炸式增长、推理能力提升带来复杂应用场景解锁可能等。美股科技领域,建议继续围绕基础设施、AI应用等环节,重点布局AI计算芯片、HBM、AI网络设备、IDC、基础&应用软件、互联网服务等领域。
▍事项:
北京时间8月8日凌晨,OpenAI发布GPT-5系列模型,引发资本市场关注。根据OpenAI官网,该系列模型包含处理常规问题的GPT-5 main模型、解决复杂任务的GPT-5 Pro和更加轻量化的GPT-5 mini与Nano模型。该系列模型的性能进步明显。根据OpenAI官网,在通用能力测试方面,GPT-5数学测试AIME 2025得分达94.6%(o3为88.9%),博士知识测试GPQA-Diamond等分为88.4%(o3为83.3%),AI高阶能力标杆测试HLE无工具前提下得分GPT-5达30.7%(o3为14.7%)。而在垂类场景测试上,GPT-5在编程测试SWE-bench Verify中得分为74.9%,在医疗健康场景测试HealthBench Hard中得分为46.2%(o3为31.6%),展现出应用场景拓展的优秀潜力。
▍模型亮点:推理能力进步明显,性价比显著提升。
根据OpenAI官网,我们认为GPT-5系列模型的核心亮点包括:
1)幻觉显著降低,根据OpenAI官网,GPT-5在多个测评中的错误率仅为o3的20%,对无法完成的任务的欺骗率也大幅下降,例如在概念理解测试LongFact-Concepts和对象理解测试LongFact-Objects中GPT-5的错误率分别为0.7%和0.8%,而o3的错误率分别为4.5%和5.1%;
2)推理效率显著提升,GPT-5可以用更少的思考时间输出更好的结果,比 o3 的输出token减少50-80%的情况下表现更好;
3)推理成本大幅降低,根据OpenAI官网,GPT-5 main定价为输入1.25美元/百万token,输出10美元/百万token,较o3(输入2美元/百万token,输出8美元/百万token)小幅降低,与Gemini 2.5 Pro齐平;Mini和Nano则分别是GPT-5 main的20%和4%。我们认为GPT-5的性价比大幅提升的重要原因在于其路由器设计。根据OpenAI官网,GPT-5内嵌了一个实时路由器,该路由器不仅可根据对话复杂度、工具需求等因素选择合适的模型,而且还能持续学习用户的切换行为、反馈偏好和答案准确性,不断优化分配策略。
▍市场定位:C端面向全体用户,B端定价具备较强吸引力,多模态能力提升后应用场景预计将大幅拓展。
C端市场方面,根据OpenAI官网,目前GPT-5已经开始向所有Plus、Pro、团队及免费用户推出,企业和教育用户将在一周后获得访问权限。免费用户与付费用户在GPT-5访问权限上的差异体现在使用量上,Pro订阅用户订阅费用为200美元/月,可无限使用GPT-5,并能访问GPT-5 Pro;Plus用户订阅费用为20美元/月,GPT-5的使用额度显著高于免费用户;免费用户达到 GPT-5 的使用限额,系统将自动切换至 GPT-5-mini版本。
B端市场市场方面,目前GPT-5的API定价与Gemini 2.5 Pro持平,但在性能上预计领先于Grok-4、Gemini 2.5 Pro等模型,因此我们预计B端市场GPT-5的份额将有所增长。GPT-5目前仍存在多模态能力上的短板,只支持图像输入,不支持多模态输出。我们认为由于该模型推理能力较强,在多模态能力提升之后,应用场景预计将大幅拓展。
▍趋势展望:算力堆积+强化学习依然是模型能力进步重要路径,前沿模型演进继续保持快节奏。
根据IBM和MIT研究者的论文《A Hitchhiker's Guide to Scaling Law Estimation》(Choshen,Zhang和Andreas,2024),理论上来看现阶段预训练Scaling Law依旧有效。结合众多北美模型厂商的实践来看,当前继续堆积算力并结合强化学习改进模型能力的路径依然有效:1)Grok系列模型中Grok-2到Grok-3乃至Grok-4投入的算力每一代都有大幅的增长,推动其模型性能大幅提升;2)强化学习技术也在不断进步,在强化学习技术的加持下,GPT-5、Grok-4、Claude 4.1等模型的工具调用能力快速进,对复杂问题的处理能力不断提升。同时根据各公司官网,我们认为2025年模型迭代呈现加速状态,平均每2个月头部厂商就会发布一款新模型并刷新模型性能极限。我们认为这种趋势仍将持续,基础模型能力将快速进步。
▍风险因素:
AI核心技术发展不及预期风险;科技领域政策监管持续收紧风险;私有数据相关的政策监管风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及预期风险;AI潜在伦理、道德、用户隐私风险;企业数据泄露、信息安全风险;行业竞争持续加剧风险等。
▍投资策略:
OpenAI等模型厂商的快速迭代对当前全球AI产业影响明显,包括算力基建和应用落地等层面,相应体现在:科技巨头在前沿模型领域的军备竞赛、推理&scaling law&多模态等带来的算力持续爆炸式增长、推理能力提升带来更多应用场景解锁等。美股科技领域,建议继续围绕基础设施、AI应用等环节,重点布局AI计算芯片、HBM、AI网络设备、IDC、基础&应用软件、互联网服务等领域。
本文源自中信证券研究
相关文章
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-11 0
白马会所,这个在上海某个角落悄然存在的奢华场所,曾经吸引了大量富婆和嫩模。这里的规则与传统的奢侈会所截然不同:富婆们成了主要客户,嫩模变成了小鲜肉,而...
2025-08-11 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-11 0
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-08-11 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-11 0
发表评论