俄罗斯与韩国研究人员开发AI内容过滤系统，可拦截恶意指令与数据泄露

抖音快讯 2025年08月09日 12:31 1 admin

据塔斯社网8月8日报道，近日，俄韩研究人员联合开发出一款AI内容过滤系统原型，能自动过滤用户查询中的恶意指令、个人数据及禁用主题，并检查生成文本是否含恶意内容、偏见或信息泄露。MWS AI（MTS Web Services旗下公司）新闻部门报道了这一成果。

MWS AI高级工业工程师Danila Katalshov指出，俄罗斯仅7%的用户使用企业AI解决方案，多数依赖公共模型，存在数据泄露风险，也限制了AI在医疗、公共行政等关键领域的应用，而外部自定义过滤器可有效降低此类风险。

该通用外部过滤器兼容各类大型语言模型，作为用户请求与模型响应的中间环节，输入端可识别恶意指令、机密信息及禁用主题，输出端则依据行业标准、法律要求及公司内部政策设置的规则，检查模型生成内容，能降低AI遭受查询攻击的脆弱性、减少文本毒性、防止机密数据泄露。

在限制较少的Grok-2人工智能系统上测试显示，该系统抗攻击能力较强：不使用过滤器时，攻击成功率达78%，使用后降至14%；模型响应毒性从72%降至18%，个人数据过滤准确率高达95%。

研究同时指出，基线保护级别下，过滤会使响应延迟增加约85毫秒，启用企业数据库搜索则延迟增至450毫秒，这对多数交互式应用可接受，但高负载系统或需额外优化。

（编译：梓柠）

链接：https://tass.ru/nauka/24736119

中富电路：公司具备光模块板的制程能力

发表评论