OpenAI 启动先锋计划,旨在重塑 AI 模型评分体系
作者:灵犀软件园时间:2025-06-21 18:20:30
本站 4 月 10 日消息,OpenAI 宣布启动 OpenAI 先锋计划(OpenAI Pioneers Program),致力于改善当前 AI 模型的评分方式。该公司认为现有的 AI 基准测试存在缺陷,而该计划将专注于创建能够“设定优秀标准”的评估体系。
随着 AI 技术在各行业的应用加速普及,深入了解并提升其在现实世界中的影响力变得至关重要。OpenAI 在其博客中指出,创建特定领域的评估指标是更好地反映实际应用场景、帮助团队在实际且高风险环境中评估模型性能的有效途径之一。
近期,众包基准测试平台 LM Arena 与 Meta 的 Maverick 模型引发的争议凸显了一个问题:如今,人们很难明确区分不同 AI 模型之间的差异。许多广泛使用的 AI 基准测试侧重于衡量模型在一些晦涩任务上的表现,例如解决博士级别的数学难题。还有一些基准测试容易**纵,或者与大多数人的偏好不一致。
据本站了解,通过先锋计划,OpenAI 希望为法律、金融、保险、医疗保健和会计等特定领域创建基准测试。该实验室表示,在未来几个月内,将与“多家公司”合作设计定制化的基准测试,并最终将这些基准测试公开,同时提供“行业特定”的评估。
OpenAI 在博客中提到,先锋计划的第一批参与者将专注于初创公司,这些公司将帮助奠定该计划的基础。他们将从众多初创公司中挑选出少数几家,这些公司都在从事高价值、应用广泛的用例,AI 在其中可以产生实际影响。
参与该计划的公司还将有机会与 OpenAI 团队合作,通过强化微调技术改进模型。这种技术可以针对一组特定任务优化模型,从而提升其在特定领域的表现。
然而,一个关键问题是 AI 社区是否会接受由 OpenAI 资助创建的基准测试。此前,OpenAI 曾在财务上支持过基准测试工作,并设计了自己的评估方法。但与客户合作发布 AI 测试可能会被视为在道德上存在争议。
相关文章
-
OpenAI 启动先锋计划,旨在重塑 AI 模型评分体系
本站 4 月 10 日消息,OpenAI 宣布启动 OpenAI 先锋计划(OpenAI Pioneers Program),致力于改善当前 AI 模型的评分方式。该公司认为现有的 AI 基准测试存在
-
谷歌 Pixel 新专利:解锁手机背面手势操控
本站 4 月 11 日消息,科技媒体 patentlyapple 昨日(4 月 10 日)发布博文,报道称谷歌获批一项专利,通过智能手机的感应外壳检测用户输入,生成输入位置“地图”,并利用机器学习模型
-
微软公布 50 周年纪念版 Surface Laptop 笔记本:刻有 1975 年 Logo、只抽奖不公开销售
本站 4 月 11 日消息,微软在其 Instagram 公布了一款 50 周年纪念版 Surface Laptop,不过这款笔记本为“只抽奖不公开销售”性质。本站注意到,这款纪念版 Surface
-
英睿达 PCIe Gen5 M.2 固态硬盘 P510 上线官网,预计 5 月 21 日全球发售
本站 4 月 11 日消息,英睿达官网现已上线今年初公布的主流级 PCIe Gen5 NVMe M 2 2280 固态硬盘 P510 ,提供 1TB 和 2TB 两个容量版本。P510 固态硬盘基于美
-
比亚迪推出置换升级优惠活动,秦 PLUS DM-i 智驾版限时综合补贴价 6.98 万元起
本站 4 月 11 日消息,比亚迪王朝网销售事业部总经理路天今日在微博上宣布,推出置换升级优惠活动,第二代秦 PLUS DM-i 智驾版限时综合补贴价 6 98 万元起,第二代秦 PLUS EV 智驾
-
苹果折叠 iPhone / iPad 专利曝光:创新铰链设计,延长柔性屏寿命
本站 4 月 11 日消息,科技媒体 patentlyapple 昨日(4 月 10 日)发布博文,报道称苹果公司获批新专利,勾勒了未来折叠 iPad iPhone,聚焦介绍了铰链设计和柔性屏方案