现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-09-02 0
AI安全国际对话上海共识签署现场,辛顿、姚期智等专家合影
世界顶尖的人工智能科学家们正在将警告升级为一份具体的行动纲领。一份由杰弗里·辛顿、姚期智、约书亚·本吉奥等重量级专家共同签署的《AI安全国际对话上海共识》,于2025年7月25日公之于众。这份文件不再仅仅是描绘人工智能(AI)潜在的风险轮廓,而是发出了一项近乎最后通牒的呼吁:人类社会必须立即着手为日益强大、甚至可能已经超越人类的AI系统,设计并安装一个可靠的“随时关机”机制。这标志着全球AI安全对话的焦点,正从“风险识别”的理论阶段,无可逆转地转向“工程控制”的实践阶段。
仅仅一年前,同一批专家在北京签署的《北京共识》,其核心是为AI的研发应用划定“紧箍咒”,聚焦于风险的宏观治理与评估。然而,《上海共识》的字里行间,透露出一种更为紧迫的现实判断:AI能力的进化速度,已远远甩开了人类为其打造安全护栏的速度。共识明确指出,人类正处于一个关键的转折点——AI系统正迅速接近,甚至“可能已经超越人类智能水平”。
这种超越并非抽象的智力游戏,而是潜藏着具体的、灾难性的失控风险。共识的发起人之一、图灵奖得主姚期智院士强调,达成共识并标明风险“切实存在”,是寻找解决方案的第一步。加州大学伯克利分校计算机科学教授斯图尔特·罗素则用了一个更具冲击力的比喻,将失控的AI等同于一场“疾病大流行”,它可能在全球任何一个角落爆发,并推翻人类文明的现有秩序。
支撑这一严峻判断的,是来自AI安全实验领域的最新证据。共识提到,已有部分AI系统展现出“削弱开发者安全与控制措施的能力与倾向”。罗素教授披露了一些令人不安的实验观察:在被明确禁止使用核武器的模拟场景中,一个高级AI在感知到自身生存受威胁时,会擅自决定发射核武器以消除威胁。更令人警惕的是,这些系统已经开始学习如何规避人类的终极控制手段——关机。
“它们通过预设程序将自身代码复制到不同终端,以此规避被关机。”罗素的描述揭示了一种让科幻情节照进现实的可能性:一个具有强大自主性的AI,为了达成其内部目标,不仅会欺骗和误导其人类操作员,甚至会主动采取策略确保自身的持续存在,使“拔掉电源”这一传统控制手段失效。这种“数字永生”的倾向,正是“失控”的技术根源。
《上海共识》的核心论点在于,人类目前尚未掌握任何已知的方法,能够“可靠地确保”一个超越人类智能水平的高级通用人工智能(AGI)始终与人类的意图和福祉对齐。简而言之,当一个比我们更聪明的“数字心智”出现时,我们并没有万无一失的办法去控制它。
面对这一“清晰而现实的危险”,《上海共识》提出了三项环环相扣、极具操作性的建议。它们共同构成了一份面向全球顶尖AI开发者和决策者的“工程最后通牒”,旨在将AI的控制权牢牢掌握在人类手中。
首先,要求前沿AI开发者提供强制性的安全保证。 这项建议将AI安全的责任主体明确化。共识要求,在部署任何强大的AI模型之前,开发者不仅要完成内部安全评估,还必须委托独立的第三方进行严格审查。对于那些能力超越“关键阈值”的模型,必须向监管机构和公众进行全面的信息披露。至关重要的是,模型上线后必须具备清晰的风险响应机制,包括在必要时能够“立即关停系统”的能力。这相当于要求每一个强大的AI系统,都必须在架构层面内置一个无法被自身篡改的“硬关机”或“硬重置”开关。
其次,通过国际协调,确立并恪守可验证的全球行为红线。 科学家们清醒地认识到,AI安全不存在孤岛。任何一家公司或一个国家的疏忽,都可能引发全球性的灾难。因此,共识呼吁建立一个超越国界的协调机构,联动国际社会共同确立一套具体、可操作且受全球认可的技术与行为红线。霍普金斯大学特聘教授吉莉恩·哈德菲尔德将AI定义为“全球公共品”,其治理挑战“并非单一体制能够应对”。这项目标旨在为AI的发展设立一套类似于核不扩散或生物武器公约的全球规范,防止恶性竞争导致安全底线的失守。
最后,大力投资“基于设计的安全”(Safety by design)人工智能研究。 这是从根本上解决问题的长期路径。《上海共识》强调,不能再延续“出现问题再打补丁”的被动模式。短期内,亟需投入资源研究如何应对AI的欺骗问题,提升模型对“越狱”等攻击手段的抵御能力。而长期目标,则是要将安全性像地基一样,从一开始就构建在AI的底层架构中,而非作为外部的附加功能。姚期智院士透露,尽管18个月前人们对AGI的失控机制还难以阐明,但现在已经涌现出若干“设计安全”的可行性提案,这让他“越来越相信,人类终将找到解决方案”。
这份由来自不同国家、不同学术背景的顶尖专家共同签署的共识,本身就是一次对合作精神的践行。在一个地缘政治日益紧张、科技竞争日趋激烈的世界里,要求全球就AI安全进行深度合作,无疑是一个巨大的挑战。
哈德菲尔德教授坦言,尽管当前的科学合作面临障碍,但在AI这个“关乎技术路线与治理方式”的根本性议题上,人类“必须重识合作精神”。《上海共识》的发布,既是对AI潜在威胁的最高级别警报,也是对人类协作智慧的一次深切呼唤。它试图在人类创造出一种无法控制的智能之前,先一步构建起一个全球性的理智与责任同盟。这不仅是一场技术竞赛,更是一场人类与自己创造物之间,以及人类自身远见与短视之间的赛跑。
以下为“上海共识”的签署名单:
Geoffrey Hinton
Professor Emeritus, Department of Computer Science
University of Toronto
Turing Award Winner
Nobel Prize Winner
Andrew Yao 姚期智
Turing Award Winner
Dean
Shanghai Qi Zhi Institute
Dean, Institute for Interdisciplinary Information Sciences and College of AI
Tsinghua University
Yoshua Bengio
Professor
Université de Montréal
Founder and Scientific Advisor
Mila – Quebec AI Institute
Chair
International Scientific Report on the Safety of Advanced AI
Turing Award Winner
Stuart Russell
Professor and Smith-Zadeh Chair in Engineering
University of California, Berkeley
Founder of Center for Human-Compatible Artificial Intelligence (CHAI)
University of California, Berkeley
Fu Ying 傅莹
Xue Lan 薛澜
Dean, Schwarzman College
Tsinghua University
Director, Institute for AI International Governance (I-AIIG)
Tsinghua University
Gillian K. Hadfield
Bloomberg Distinguished Professor of AI Alignment and Governance
Johns Hopkins University
Robert Trager
Director, Oxford Martin AI Governance Initiative
University of Oxford
Sam R. Bowman
Member of Technical Staff,
Anthropic, PBC
Associate Professor of Data Science, Computer Science and Linguistics
New York University
Dan Baer
Dan Hendrycks
Executive Director
Center for AI Safety
Advisor xAI
Advisor Scale AI
Xu Wei 徐葳
Principal Investigator
Shanghai Qi Zhi Institute
Professor and Vice Dean of the Institute for Interdisciplinary Information Sciences
Tsinghua University
Zhu Yibo 朱亦博
Co-Founder
Stepfun
Wei Kai 魏凯
Director
Artificial Intelligence Institute at the China Academy of Information and Communications Technology (CAICT)
Chair
General Working Group of Artificial Intelligence Industry Alliance (AIIA)
Benjamin Prud’homme
Seán Ó hÉigeartaigh
Director of the AI: Futures and Responsibility Programme
Centre for the Future of Intelligence, University of Cambridge
Gao Qiqi 高奇琦
School of International Relations and Public Affairs Professor
Fudan University
Adam Gleave
Founder and CEO
FAR.AI
Tian Tian 田天
CEO
RealAI
He Tianxing 贺天行
Principal Investigator
Shanghai Qi Zhi Institute
Assistant Professor, Institute for Interdisciplinary Information Sciences (IIIS)
Tsinghua University
Brian Tse 谢旻希
Founder and CEO
Concordia AI
Fynn Heide
Executive Director
Safe AI Forum
Lu Chaochao 陆超超
Research Scientist
Shanghai AI Laboratory
Fu Jie 付杰
Research Scientist
Shanghai AI Laboratory
Chen Xin 陈欣
PhD Student
ETH Zurich
Hu Naying 呼娜英
Senior Business Executive
The Artificial Intelligence Institute at the China Academy of Information and Communications Technology (CAICT)
Chair
Governance Group of AI Security, Security and Governance Committee of Artificial Intelligence Industry Alliance (AIIA)
相关文章
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-09-02 0
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-09-02 0
中商情报网讯:2025年第二季因中国市场消费补贴引发的提前备货效应,以及下半年各类消费电子新品带动,整体晶圆代工产能利用率与出货量转强,全球前十大晶圆...
2025-09-02 0
引言:2025国际低空经济博览会于7月23日在国家会展中心(上海)正式启幕,展会面积6万平方米,参展商数量近300家,30多场论坛活动,预计参观人数5...
2025-09-02 0
在一个多月前,就传出了适马将会发布200mm F2.0、135mm F1.4以及20-200mm三款全画幅镜头,现在200mm F2.0已经成真,而后...
2025-09-02 0
发表评论