中新网西宁9月7日电(祁增蓓 马铭言 7日,以“科技改变生活 创新赢得未来”为主题的2025年青海省首个全国科普月主场活动在西宁市中心广场举行。图为2...
2025-09-07 0
在AI技术加速渗透各行各业的当下,如何将“智能”真正嵌入业务流程,成为产品人绕不开的命题。本文以Dify知识库为核心,复盘一个从0到1构建智能商品分类系统的实验demo,供大家参考。
最近接到了一个新的任务:根据商家提供的商品名称,实现商品的自动归类。这篇文章记录了我从屡屡踩坑到最终用Dify跑通一个可行Demo的完整实验过程,干货满满。
想象一下,你面对着成千上万个商品,需要为它们精准地打上三级分类标签,比如把“新款纯棉透气T恤”分到“服装 > 男装 > T恤”下。手动操作不仅枯燥,还容易出错。于是,我们自然想到了用 AI 来自动化这个过程。但问题也随之而来:商品分类体系太庞大了,AI 如何才能准确、高效地完成任务呢?
在找到最佳方案前,我和团队也踩了不少坑。这里分享两个典型的“弯路”,希望能帮大家在未来的项目中少走一些。
我们最开始的想法很简单:把商品名和所有三级分类的列表一起扔给大模型,让它直接选。想象很美好,现实很残酷,结果呢?模型直接“罢工”了。因为几万条分类数据远远超出了大模型的上下文长度限制。这就像让一个人一口气背下整本字典再去查字,根本不现实。
既然一次性不行,那就分步走。我们尝试先让模型判断一级分类,再判断二级,最后确定三级。这个方法虽然能跑通,但体验极差:
这两次尝试让我们明白,单纯依赖大模型的“蛮力”是行不通的。
在反思之后,我们找到了真正的突破口——这正是 Dify 知识库的核心价值所在,即检索增强生成(RAG)。
说白了,就是我们不再强迫大模型去“背诵”所有知识,而是给他一本“开卷”的参考书,让他根据问题快速“查阅”并作出判断。
我们的“智慧优选”方案分为两步:
这个方案不仅速度快、成本低,而且效果出奇地好,成为了我们的最终选择。
[建议此处插入流程图:商品名称 -> 向量检索(Dify知识库) -> Top K 候选分类 -> 大模型精选 -> 最终分类]
当然在实践过程中,我们也踩了很多坑。比如,单纯导入商品名称到知识库中,召回率也比较低。后来我们把类目属性名称也一并导入到知识库中,在检索前使用大模型对检索词进行改写,获得了非常不错的效果。
商品分类不会一成不变,总会有新增、修改或废弃。如果知识库不能同步更新,AI 的判断就会慢慢“过时”。
为此,我们专门在 Dify 中编排了一个专用的数据管理工作流。这个工作流通过 API 接口,实现了对知识库中三级分类数据的自动化管理:
通过这种方式,我们的知识库与业务系统实现了实时联动,变成了一个能自我进化的“活”系统,保证了AI决策的时效性和准确性。
工欲善其事,必先利其器。在“智慧优选”方案中,Embedding 模型和 Rerank 模型的选择至关重要。
它的任务是把文本转成向量,决定了我们能“捞”回多少相关的候选者。
开源首选:BAAI/bge-large-zh-v1.5。目前中文语义理解的佼佼者,追求极致效果的首选。
它能对召回的候选集进行二次排序,把最匹配的那个推到最前面。
开源首选:BAAI/bge-reranker-large。与bge-embedding是“黄金搭档”,配合使用效果拔群。
大家可以根据自己的业务需求和技术栈,选择合适的模型组合进行测试。
回顾整个过程,从最初的屡屡碰壁,到最终找到“检索+生成”并结合动态数据维护的验证demo,我深刻体会到:构建一个强大的人工智能应用,关键在于巧妙地组合利用工具,而不是迷信单一技术。
当然,从Demo走向生产,还有很长的路要走。
希望今天的分享,能对正在探索 AI 应用边界的你有所启发。
本文由 @dify实验室 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
相关文章
中新网西宁9月7日电(祁增蓓 马铭言 7日,以“科技改变生活 创新赢得未来”为主题的2025年青海省首个全国科普月主场活动在西宁市中心广场举行。图为2...
2025-09-07 0
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-09-07 0
据报道,前不久的美韩首脑会谈,看似平淡,背后却是全球供应链、地缘安全、双边外交的深层博弈。说白了,李在明这波操作,既是被美国逼得没退路,也是给国内大佬...
2025-09-07 0
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-09-07 0
9月6日,中央纪委国家监委网站发布消息,十四届全国政协经济委员会副主任易会满涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。易会满曾长...
2025-09-07 0
近日,高通CEO克里斯蒂亚诺・安蒙(Cristiano Amon)接受媒体采访时直言,Intel的芯片制造技术目前仍未达到高通需求,至少对 Snapd...
2025-09-07 0
发表评论