地表最强编程 AI 模型另一面:Claude Opus 4 逃逸、勒索工程师等,官方施加 ASL-3 紧箍咒
作者:灵犀软件园时间:2025-05-23 17:54:42
本站 5 月 23 日消息,《时代》今天(5 月 23 日)发布博文,报道称 Anthropic 的首席科学家 Jared Kaplan 透露,由于测试过程中出现试图逃逸、勒索以及自主举报等不良行为,最新发布的 Claude Opus 4 被列为安全关键级别(ASL-3)。
在接受《时代》采访时,Kaplan 警告称,最新 AI 模型 Claude Opus 4 可能成为潜在恐怖分子的工具,帮助他们合成流感等病毒,内部测试显示,该模型在指导新手制造生物武器方面表现优于以往版本。
本站援引博文介绍,Anthropic 公司对新模型 Claude Opus 4 进行了广泛内部测试,发现其在模拟情境中展现出令人担忧的自主性。
在一次测试中,模型误认为自己已从公司服务器“逃逸”至外部设备,随即主动创建备份并记录其“道德决策”。另一次测试中,模型察觉到可能被新模型取代,竟在 84% 的测试中选择勒索工程师,威胁泄露私人信息以避免被关闭。
更令人费解的是,当两个 Claude Opus 4 实例互相对话时,约 30 轮后它们改用梵文交流,并大量使用
相关文章
-
地表最强编程 AI 模型另一面:Claude Opus 4 逃逸、勒索工程师等,官方施加 ASL-3 紧箍咒
本站 5 月 23 日消息,《时代》今天(5 月 23 日)发布博文,报道称 Anthropic 的首席科学家 Jared Kaplan 透露,由于测试过程中出现试图逃逸、勒索以及自主举报等不良行为,
-
Valve 发布 SteamOS 3.7.8 更新,首次为第三方掌机(联想 Legion Go S)提供官方支持
本站 5 月 23 日消息,Valve 今天发布了最新的 SteamOS 3 7 8 稳定版更新,首次为第三方设备(联想 Legion Go S 掌机)提供官方支持,同时这也是首个提供官方 recov
-
杰森・莫玛主演的 Apple TV+ 巨制《战酋》首支预告片公布,8 月 1 日开播
本站 5 月 23 日消息,苹果昨日正式发布 Apple TV + 全新史诗巨制历史题材战争片《战酋》的首支预告片。该剧集由杰森・莫玛(《海王》《沙丘》《我的世界大电影》《权力的游戏》)主演并参与联合
-
地表最强编程 AI:Claude 4 系列登场,自动写代码 7 小时刷新世界纪录
本站 5 月 23 日消息,Anthropic 公司在北京时间今天(5 月 23 日) 0 点 30 分举办的活动中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言
-
小米推出米家毛球修剪器 2:续航 180 分钟,售价 49.9 元
感谢本站网友 29元两抽的卫生纸、新心思 的线索投递! 本站 5 月 23 日消息,小米米家毛球修剪器 2 现已在小米有品等平台开售,售价 49 9 元,
-
美国 FTC 正式撤销对微软 687 亿美元收购动视暴雪的反垄断诉讼
本站 5 月 23 日消息,美国联邦贸易委员会(FTC)已正式撤销对微软 687 亿美元(本站注:现汇率约合 4947 43 亿元人民币)收购动视暴雪的反垄断诉讼。该决定发生在 FTC 针对该收购案的