现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-08-16 0
掌握 RAG(检索增强生成),就是把大模型从“聪明却不可靠的演讲家”升级为“随时查资料、句句有出处”的超级顾问,让 AI 功能在产品里真正可用、敢用、可持续用。作为AI产品经理的我们,这也是必须掌握的技术原理。
幻觉(Hallucination)
传统大模型靠内部参数“猜”答案,知识盲区只能靠编造填补,导致事实性错误频发。RAG 把回答建立在检索到的原文片段上,模型只负责“总结引用”,显著降低一本正经胡说八道的概率。
知识时效性
训练一次百亿级模型≈烧掉一栋楼的钱,不可能周周重训。RAG 把知识外置到可热插拔的索引库,更新文档即可秒级生效,让模型永远“活在今天”。
领域专业壁垒
通用模型对垂直领域(医疗、法律、金融)往往一知半解。RAG 允许接入私有知识库(监管条文、内部 SOP、病历库),无需重训即可让模型瞬间变成“领域专家”。
长文本窗口受限
上下文长度始终是硬瓶颈。RAG 把超长文档拆块建索引,按需检索 Top-K 片段塞进有限窗口,既突破长度限制,又避免无关信息稀释注意力。
一句话总结:RAG 把大模型从“靠记忆答题”转变为“带着参考资料答题”,一次性扫清了幻觉、时效、专业、合规、长文本、成本六大落地障碍,让高智商模型真正变成可上线、可维护、可盈利的企业级产品。
总的来说,RAG的运行分为两个流程,第一个流程为准备(提问前),准备流程又包含了两个阶段。第一个阶段为分片,第二个跌断为索引。第二个流程则是回答(提问后),整个流程包含四个阶段。第一个阶段为召回,第二个流程为重排,第三个流程为生成。
分片:在 RAG(Retrieval-Augmented Generation)系统中,“分片”(Chunking/Splitting)是提问前准备阶段的第一步,也是决定后续召回与生成质量的关键环节。它的核心任务是把长文档切成语义相对独立、长度适中的小片段,再向量化并入库,供检索时精准命中。
1)目标
在知识库构建阶段,将原始文档(PDF、Word、Markdown 等)切成若干chunk(也称 passage/block),使每个 chunk 既能表达完整语义,又不会过长,避免
2)主流切分策略
总结:把一本厚书先剪成一页页“小纸条”,根据裁剪方式得不同纸条呈现的样子不同;但是最终想要达成的目的就是让AI更好理解我们上传的知识内容。
索引:RAG 的索引阶段其实只做一件事:把“一堆文字”变成“可快速查找的向量仓库”。整个过程可以拆成两步,但每一步都围绕“让检索又快又准”这个目标展开。
当用户提问时,系统用同样的 Embedding 模型把问题转成向量,直接在索引里做向量检索,把最相关的文本块送给大模型生成答案。索引本身不再动态更新。
总结:把 RAG 索引想成“做奶茶外卖”:
一句话:提前把配料分好、贴码、排队,客人一点单就能秒配。
召回:召回阶段把“用户问的问题”变成一段高维语义向量,然后用这段向量去一个预先建好的向量库中做最近邻搜索。整个流程可以拆成下面五步:
1)统一编码
同一个经过训练的语义编码器,既把知识库里的每一段文本压缩成固定长度的语义向量,也把实时输入的问题压缩成同样长度的语义向量。这样问题和文档就在一个空间里可比了。
2)构建索引
知识库的全部向量被一次性放进一种专门支持“最近邻快速查找”的索引结构,常见的是分层可导航小世界图或倒排加乘积量化混合结构。索引只保存向量和指向原文的指针,不保留原文本身。
3)在线查询
当用户输入问题后,编码器立刻把它变成向量,然后把这个向量送到索引里。索引利用预先构建的图或聚类信息,只探索少量节点就能锁定一批候选向量,而不是逐个比对全文。
4)相似度计算
对候选向量逐一计算与问题向量的语义距离,距离越小表示内容越接近。计算完按距离从小到大排序,挑出最靠前的若干条结果。
5)返回片段
每条结果只包含原文档的标识和段落位置,系统根据这些标识把对应的原始文字片段取出,作为召回结果输出。
总结:召回就像图书馆找书,先把每本书的内容变成一张“小纸条”,纸条上写着这本书的“意思”。你提问题时,也给你写一张“问题纸条”。系统拿你的纸条去跟所有书纸条比相似度,挑出最像的前几本,把对应的书页拿出来交给你。
重排:重排环节只负责把已召回的候选段落重新排序,核心是一套“段落级重排器”。其工作机理可拆成四层:
总结:重排就像一次“二次面试”。
就这么简单。
生成:生成阶段只负责一件事:拿到经过重排后留下的精炼上下文,与用户问题一起,生成一段连贯、准确、可控的最终答案。其工作流程可拆成四层:
1)输入封装
系统把用户问题放在最前面,随后插入若干条上下文段落,段与段之间用特殊分隔符隔开,整体再附上一段系统级提示,告诉模型“请严格依据下文内容作答,不要杜撰”。
2)位置编码与注意力掩码
为了让模型在阅读时知道哪些词来自问题、哪些词来自哪一段上下文,编码器会给每个位置打上可区分的标识,并在注意力层设置掩码,使生成过程中的每一步只能“看见”前面已经出现的所有信息,防止自环泄露。
3)逐词生成
模型以自回归方式一次输出一个词。每一步都重新扫描整段已见文本,依据上下文语义、事实一致性、语言流畅度以及预设风格,动态决定下一个最合理的词。若遇到冲突信息,模型会优先采信排序靠前的段落;若段落本身含糊,模型会采用保守策略,给出“根据现有资料无法确定”之类的表述。
4)后处理与输出
生成的原始文本先经过敏感词过滤、重复片段合并、引用标记插入等后处理,再返回给调用方。部分系统还会附带一个置信度评分,用于提示哪些句子直接摘抄自原文、哪些句子是模型综合后的转述,方便用户二次核查。
总结:生成就像“开卷考试的最后一道大题”:
把题目和参考资料一次性摆到模型面前。
模型先通读一遍,心里记下哪些段落能直接回答,哪些只是背景。
然后开始一句一句写答案:
写好后自动检查错别字、重复句,再把引用标出来,交卷。
本文由 @产品经理小易 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
相关文章
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-08-16 0
【来源:海南省地震局】8月13日,海南省地震局通过线上线下方式组织召开了地震安评新国标宣贯会,发改、资规、住建、海洋、交通等相关行业主管部门和省内安评...
2025-08-16 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-16 0
天眼查App显示,近日,上海芯致远集成电路有限公司成立,法定代表人为周梦,注册资本500万人民币,经营范围为一般项目:集成电路芯片设计及服务;集成电路...
2025-08-16 0
8月15日,一段记录飞机客舱内激烈争执的视频在各大社交平台迅速传播,引发广泛关注。网友发的视频显示,一架落地成都天府国际机场的航班上,两名旅客发生口角...
2025-08-16 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-16 0
美国总统特朗普和俄罗斯领导人普京总算要世纪会晤了,地方选在阿拉斯加的军事基地,说是和谈但怎么看都像鸿门宴。自从特朗普在白宫坐稳后就一直把结束俄乌战争挂...
2025-08-16 0
发表评论