已核验 · Jun 23, 2026

OpenAI 新基准 LifeSciBench，专门评测 AI 真实科研能力

2 个信源

OpenAI 推出 LifeSciBench，用来评估 AI 在真实生命科学研究任务上的能力，补充了面向科研工作流的开放评测。

为什么现在讲

2026 年 6 月 17 日发布，是科研、生物、政策方向受众长期关注的那类基准的新条目。

生命科学 AI 是一个受众活跃的小众领域，具名基准容易引用、容易演示。

“OpenAI 发了 LifeSciBench——任务清单一摆，你就知道它能测的是哪些 AI 声明。”

切入角度

把 LifeSciBench 放进现有的生命科学 AI 评测里对比。

形式

讲解视频

演示想法

走一遍任务类别和被评测的模型版本。

平台注意

不要把它说成全面能力的证明，基准只测具体任务。标注仍处于开放评测中的部分。固定链 OpenAI 官方文章拿真实任务清单和数字。

来自新闻

拆解

这篇拆解走一遍 LifeSciBench 的任务类别，基准说了什么、没说什么，以及怎么和现有生命科学 AI 评测做对比、不至于把结果吹过头。