金融界2025年8月6日消息,国家知识产权局信息显示,苏州科瓴精密机械科技有限公司取得一项名为“加热泵和热管理系统”的专利,授权公告号CN223190...
2025-08-06 0
从技术原理到实际使用,大模型的“幻觉”问题始终绕不开:它不仅影响输出准确性,更关系到业务决策与风险控制。本文将深入剖析AI幻觉的形成原因,探讨应对路径与工程优化思路,并从使用者视角出发,提出如何“和幻觉共处”的实践建议。
写这一篇的缘由一是因为我也在摸索如何降低 AI 幻觉提升 AI 工具使用效率,二是因为前两周在MIT学习时老师讲的一节课,刚好也解释了这个问题,所以一并做个总结,分享给大家。
近几年,大型语言模型(LLM)如 ChatGPT、Claude、Gemini 等快速走进公众视野。它们能生成结构完整、逻辑清晰的长文本,甚至可以进行代码编写、法律文书撰写、医学咨询等高难度任务。然而,我们也越来越频繁地听到一个术语:AI幻觉。
简单说,它指的是模型“说得像真的,但其实是错的”。
本文将尝试解释三个问题:
GPT 的全称是Generative Pre-trained Transformer,其核心任务是:给定一段输入,预测下一个最可能出现的词(token)。这种机制的本质是统计语言模式,而不是基于事实的知识回忆或理解。
举个例子,输入“乔布斯和马斯克在球场上”,模型会续写出“展开了一场激烈的篮球比赛”,尽管这从未真实发生。这不是模型有意捏造,而是它识别出“人名 + 球场”常出现在比赛语境中,于是生成符合语言习惯的句子。
这类“幻觉”即来自其构建方式:模型的目标不是还原事实,而是生成“在训练语料中最常见或最自然”的文本。也就是说,它输出的是“语言上的合理”,而非“世界中的真实”。
这也是幻觉的来源:在不知道答案时,模型仍然会“给出一个听起来合理的回答”。
在 MIT 的课上,教授举了一个例子:
“问 GPT 3.5:‘谁赢得了 2022 年冬奥会冰壶金牌?’——模型回答错误,称韩国女队获胜,而实际上是英国队。”
原因在于:GPT 3.5 的训练数据截止于 2021 年,不包含 2022 年的事实。因此只能“模仿出一个合理答案”,而不是“查找真实答案”。
整体来看,GPT-4 的幻觉率相较 GPT-3.5 有所下降,背后有以下几点改进:
(来源:OpenAI. :GPT-4 Technical Report. 2023)
不过,即使如此,幻觉依然存在,尤其在以下场景更容易触发:
“如果你不知道,就说不知道”
“基于我上传的文档回答”
幻觉是当前大型语言模型的结构性副产物,它既不是“错误”,也不是“欺骗”,而是模型生成机制与真实世界之间的落差,是语言模型当前能力边界的自然结果。
理解这一点,是我们理性使用 GPT 和类 AI 工具的基础,也提醒我们:生成式语言的“像真度”,并不等于它的真实性。
未来,随着外部工具接入、Agent 机制完善、责任机制明确,幻觉问题会被进一步缓解。但在那之前,任何看起来“说得头头是道”的 AI 回答,我们都应保留验证的习惯。
作者:张艾拉 公众号:Fun AI Everyday
本文由 @张艾拉 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 Pixabay,基于CC0协议
相关文章
金融界2025年8月6日消息,国家知识产权局信息显示,苏州科瓴精密机械科技有限公司取得一项名为“加热泵和热管理系统”的专利,授权公告号CN223190...
2025-08-06 0
金融界2025年8月6日消息,国家知识产权局信息显示,合肥众波功能材料有限公司取得一项名为“基于SEM的压电单晶微观形貌检测方法及系统”的专利,授权公...
2025-08-06 0
2025年注定是全球机器人产业发展的关键一年。刚刚过去的2025世界人工智能大会,让我们看到机器人从实验室走入工厂、家庭、应急场景,灵巧操作与人机协同...
2025-08-06 0
金融界2025年8月6日消息,国家知识产权局信息显示,安徽芯宇驰半导体科技有限公司取得一项名为“一种半导体器件封装设备”的专利,授权公告号CN1198...
2025-08-06 0
金融界8月6日消息,有投资者在互动平台向南极电商提问:你好,请问咱们公司有跨境电商的相关业务吗?公司回答表示:尊敬的投资者你好,公司跨境业务尚处于孵化...
2025-08-06 0
【CNMO科技消息】8月6日,有博主在社交平台上疑似曝光了小米16 Ultra的影像配置。他透露,该机将配备全主摄CMOS,支持人像连续算法,并搭载一...
2025-08-06 0
据quantumzeitgeist网8月5日报道,美国研究团队成功开发出名为"运行数据共享"(ODS)的创新系统,有效解决了低轨互联网卫星对射电天文台...
2025-08-06 0
发表评论