中信证券：GPT-5发布，性能&性价比不断提升，场景持续拓展

游戏天地 2025年08月10日 23:36 1 admin

近期OpenAI发布GPT-5，引发资本市场关注。该模型推理能力进步明显，不仅在通用场景测试中得分较前代旗舰模型o3提升明显，而且在幻觉测试中错误率最低降低至0.7%；定价与Gemini 2.5 Pro等主流模型持平，性价比显著提升。而在垂类场景如编程和医疗上，GPT-5亦有不错的测评表现，展现出良好的场景拓展潜力。我们认为OpenAI等模型厂商近期的快速更新迭代的影响包括：科技巨头在前沿模型领域的军备竞赛、推理&scaling law&多模态等带来的算力持续爆炸式增长、推理能力提升带来复杂应用场景解锁可能等。美股科技领域，建议继续围绕基础设施、AI应用等环节，重点布局AI计算芯片、HBM、AI网络设备、IDC、基础&应用软件、互联网服务等领域。

▍事项：

北京时间8月8日凌晨，OpenAI发布GPT-5系列模型，引发资本市场关注。根据OpenAI官网，该系列模型包含处理常规问题的GPT-5 main模型、解决复杂任务的GPT-5 Pro和更加轻量化的GPT-5 mini与Nano模型。该系列模型的性能进步明显。根据OpenAI官网，在通用能力测试方面，GPT-5数学测试AIME 2025得分达94.6%（o3为88.9%），博士知识测试GPQA-Diamond等分为88.4%（o3为83.3%），AI高阶能力标杆测试HLE无工具前提下得分GPT-5达30.7%（o3为14.7%）。而在垂类场景测试上，GPT-5在编程测试SWE-bench Verify中得分为74.9%，在医疗健康场景测试HealthBench Hard中得分为46.2%（o3为31.6%），展现出应用场景拓展的优秀潜力。

▍模型亮点：推理能力进步明显，性价比显著提升。

根据OpenAI官网，我们认为GPT-5系列模型的核心亮点包括：

1）幻觉显著降低，根据OpenAI官网，GPT-5在多个测评中的错误率仅为o3的20%，对无法完成的任务的欺骗率也大幅下降，例如在概念理解测试LongFact-Concepts和对象理解测试LongFact-Objects中GPT-5的错误率分别为0.7%和0.8%，而o3的错误率分别为4.5%和5.1%；

2）推理效率显著提升，GPT-5可以用更少的思考时间输出更好的结果，比 o3 的输出token减少50-80%的情况下表现更好；

3）推理成本大幅降低，根据OpenAI官网，GPT-5 main定价为输入1.25美元/百万token，输出10美元/百万token，较o3（输入2美元/百万token，输出8美元/百万token）小幅降低，与Gemini 2.5 Pro齐平；Mini和Nano则分别是GPT-5 main的20%和4%。我们认为GPT-5的性价比大幅提升的重要原因在于其路由器设计。根据OpenAI官网，GPT-5内嵌了一个实时路由器，该路由器不仅可根据对话复杂度、工具需求等因素选择合适的模型，而且还能持续学习用户的切换行为、反馈偏好和答案准确性，不断优化分配策略。

▍市场定位：C端面向全体用户，B端定价具备较强吸引力，多模态能力提升后应用场景预计将大幅拓展。

C端市场方面，根据OpenAI官网，目前GPT-5已经开始向所有Plus、Pro、团队及免费用户推出，企业和教育用户将在一周后获得访问权限。免费用户与付费用户在GPT-5访问权限上的差异体现在使用量上，Pro订阅用户订阅费用为200美元/月，可无限使用GPT-5，并能访问GPT-5 Pro；Plus用户订阅费用为20美元/月，GPT-5的使用额度显著高于免费用户；免费用户达到 GPT-5 的使用限额，系统将自动切换至 GPT-5-mini版本。

B端市场市场方面，目前GPT-5的API定价与Gemini 2.5 Pro持平，但在性能上预计领先于Grok-4、Gemini 2.5 Pro等模型，因此我们预计B端市场GPT-5的份额将有所增长。GPT-5目前仍存在多模态能力上的短板，只支持图像输入，不支持多模态输出。我们认为由于该模型推理能力较强，在多模态能力提升之后，应用场景预计将大幅拓展。

▍趋势展望：算力堆积+强化学习依然是模型能力进步重要路径，前沿模型演进继续保持快节奏。

根据IBM和MIT研究者的论文《A Hitchhiker's Guide to Scaling Law Estimation》（Choshen，Zhang和Andreas，2024），理论上来看现阶段预训练Scaling Law依旧有效。结合众多北美模型厂商的实践来看，当前继续堆积算力并结合强化学习改进模型能力的路径依然有效：1）Grok系列模型中Grok-2到Grok-3乃至Grok-4投入的算力每一代都有大幅的增长，推动其模型性能大幅提升；2）强化学习技术也在不断进步，在强化学习技术的加持下，GPT-5、Grok-4、Claude 4.1等模型的工具调用能力快速进，对复杂问题的处理能力不断提升。同时根据各公司官网，我们认为2025年模型迭代呈现加速状态，平均每2个月头部厂商就会发布一款新模型并刷新模型性能极限。我们认为这种趋势仍将持续，基础模型能力将快速进步。

▍风险因素：

AI核心技术发展不及预期风险；科技领域政策监管持续收紧风险；私有数据相关的政策监管风险；全球宏观经济复苏不及预期风险；宏观经济波动导致欧美企业IT支出不及预期风险；AI潜在伦理、道德、用户隐私风险；企业数据泄露、信息安全风险；行业竞争持续加剧风险等。

▍投资策略：

OpenAI等模型厂商的快速迭代对当前全球AI产业影响明显，包括算力基建和应用落地等层面，相应体现在：科技巨头在前沿模型领域的军备竞赛、推理&scaling law&多模态等带来的算力持续爆炸式增长、推理能力提升带来更多应用场景解锁等。美股科技领域，建议继续围绕基础设施、AI应用等环节，重点布局AI计算芯片、HBM、AI网络设备、IDC、基础&应用软件、互联网服务等领域。

本文源自中信证券研究