首页 抖音快讯文章正文

俄罗斯与韩国研究人员开发AI内容过滤系统,可拦截恶意指令与数据泄露

抖音快讯 2025年08月09日 12:31 1 admin

据塔斯社网8月8日报道,近日,俄韩研究人员联合开发出一款AI内容过滤系统原型,能自动过滤用户查询中的恶意指令、个人数据及禁用主题,并检查生成文本是否含恶意内容、偏见或信息泄露。MWS AI(MTS Web Services旗下公司)新闻部门报道了这一成果。

俄罗斯与韩国研究人员开发AI内容过滤系统,可拦截恶意指令与数据泄露

MWS AI高级工业工程师Danila Katalshov指出,俄罗斯仅7%的用户使用企业AI解决方案,多数依赖公共模型,存在数据泄露风险,也限制了AI在医疗、公共行政等关键领域的应用,而外部自定义过滤器可有效降低此类风险。

该通用外部过滤器兼容各类大型语言模型,作为用户请求与模型响应的中间环节,输入端可识别恶意指令、机密信息及禁用主题,输出端则依据行业标准、法律要求及公司内部政策设置的规则,检查模型生成内容,能降低AI遭受查询攻击的脆弱性、减少文本毒性、防止机密数据泄露。

在限制较少的Grok-2人工智能系统上测试显示,该系统抗攻击能力较强:不使用过滤器时,攻击成功率达78%,使用后降至14%;模型响应毒性从72%降至18%,个人数据过滤准确率高达95%。

研究同时指出,基线保护级别下,过滤会使响应延迟增加约85毫秒,启用企业数据库搜索则延迟增至450毫秒,这对多数交互式应用可接受,但高负载系统或需额外优化。

(编译:梓柠)

链接:https://tass.ru/nauka/24736119

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动