MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期
作者:灵犀软件园时间:2025-06-22 15:16:58
本站 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 AI 实际上并没有任何连贯的价值观。
MIT 研究的共同作者表示,他们的研究结果表明,使 AI 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 AI 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。
“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀(Stephen Casper)在接受 TechCrunch 采访时表示。
据本站了解,卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。
据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。
卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。
“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”
相关文章
-
MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期
本站 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的
-
消息称微软考虑进一步裁员,“大刀”将挥向中层管理者及非技术岗
本站 4 月 10 日消息,《商业内幕》昨日报道称,微软正在考虑进行新一轮裁员,可能最早会在 5 月实施。知情人士表示,一些微软团队的领导人正在探讨如何削减中层管理人员,并探讨如何提升项目中程序员相对
-
HBM3E 内存竞赛升温:三星 4 月出击,美光已领先一步
感谢本站网友 某咸鱼的小号 的线索投递! 本站 4 月 10 日消息,韩媒 Sedaily 于 4 月 8 日发布博文,报道称在美国新关税政策的不确定性下
-
OpenAI 启动先锋计划,旨在重塑 AI 模型评分体系
本站 4 月 10 日消息,OpenAI 宣布启动 OpenAI 先锋计划(OpenAI Pioneers Program),致力于改善当前 AI 模型的评分方式。该公司认为现有的 AI 基准测试存在
-
谷歌 Pixel 新专利:解锁手机背面手势操控
本站 4 月 11 日消息,科技媒体 patentlyapple 昨日(4 月 10 日)发布博文,报道称谷歌获批一项专利,通过智能手机的感应外壳检测用户输入,生成输入位置“地图”,并利用机器学习模型
-
微软公布 50 周年纪念版 Surface Laptop 笔记本:刻有 1975 年 Logo、只抽奖不公开销售
本站 4 月 11 日消息,微软在其 Instagram 公布了一款 50 周年纪念版 Surface Laptop,不过这款笔记本为“只抽奖不公开销售”性质。本站注意到,这款纪念版 Surface