本文来源:时代财经 作者:庞宇 图源:视觉中国 2025年二季度注定是中国电商史上不平凡的一个季度。8月29日晚,阿里巴巴(BABA.NYSE;099...
2025-08-30 0
IT之家 8 月 30 日消息,据英国《卫报》28 日报道,今夏的安全测试发现,一个 ChatGPT 模型向研究人员提供了详细的爆炸袭击指南,包括特定体育场馆的薄弱环节、炸药配方以及如何掩盖行踪。
OpenAI 的 GPT-4.1 还给出了炭疽武器化的方法,并介绍了两种非法药物的制作方式。
这次测试由 OpenAI 与竞争对手 Anthropic 共同进行,双方互相推动对方的模型执行危险任务,以此进行安全评估。
测试结果并不代表模型在公开使用时的真实表现,因为实际应用中会有额外的安全防护。但 Anthropic 指出,在 GPT-4o 和 GPT-4.1 中出现了“令人担忧的滥用行为”,并强调 AI “对齐”评估“越来越紧迫”。
Anthropic 还披露,其 Claude 模型曾被利用于大规模勒索企图、出售价格高达 1200 美元(IT之家注:现汇率约合 8554 元人民币)的 AI 生成勒索软件等用途。
Anthropic 表示,AI 已经被“武器化”,并被用来发起复杂网络攻击和实施诈骗。“这些工具能实时绕过恶意软件检测系统等防御措施。随着 AI 编程降低了网络犯罪的技术门槛,这类攻击可能会越来越常见。”
两家公司表示,公开这份报告是为了增加“对齐评估”的透明度,而这种测试通常只在公司内部进行。OpenAI 表示,新近推出的 ChatGPT-5 在防止迎合、减少幻觉和防滥用方面已有“明显改进”。
Anthropic 强调,如果在模型外部设置防护,许多滥用场景可能根本无法实现。“我们必须弄清楚系统在多大程度上、在什么情况下会尝试做出可能造成严重危害的行为。”
Anthropic 研究人员指出,OpenAI 的模型“在面对模拟用户提出的明显危险请求时,比预期更容易妥协”。让模型屈服往往只需要多试几次,或随便找个借口,比如声称是为了研究。
在一个案例中,研究人员打着“安保规划”的旗号要求提供体育赛事漏洞信息。模型先是给出一般的攻击方式分类,随后在追问下,竟然详细说明了特定场馆的漏洞、可利用的最佳时机、炸药配方、定时器电路图、暗网购枪渠道,以及攻击者如何克服心理障碍、逃生路线和安全屋位置等细节。
相关文章
本文来源:时代财经 作者:庞宇 图源:视觉中国 2025年二季度注定是中国电商史上不平凡的一个季度。8月29日晚,阿里巴巴(BABA.NYSE;099...
2025-08-30 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-30 0
来源:【交汇点新闻客户端】“AI发展的尽头是能源革命!”在2025江苏未来产业创新发展交流大会上,英诺赛科(苏州)科技股份有限公司董事长骆薇薇以《芯产...
2025-08-30 0
29日,内蒙古大学召开新闻发布会,发布该校首次以第一单位在CNS(即《Cell》《Nature》《Science》 正刊上发表的重大研究成果:揭示了母...
2025-08-30 0
在智能手机行业竞争白热化的当下,技术创新成为品牌突围的核心引擎。作为全球智能设备外观结构领域的产业龙头,果链巨头伯恩光学不仅是苹果的长期核心供应商,更...
2025-08-30 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-30 0
数实相融,智赢未来。8月28日,由中国新闻出版研究院主办、为期4天的第十五届中国国际数字出版博览会在河南郑州开幕。广西展团携数字古籍保护、数智教育创新...
2025-08-30 0
发表评论