返回今日选题

已核验 · Jul 1, 2026

Anthropic 同日双发:Sonnet 5 把 agentic 提到新档,Claude Science 给科研者造工作台

3 个信源

Anthropic 在 2026 年 6 月 30 日同一天发布 Claude Sonnet 5(描述为「迄今最具 agentic 能力的 Sonnet,在 coding 与日常专业工作上提供顶级智能」)与 Claude Science(可定制的科研 app,集成研究者常用的工具与包,产出可审计 artifacts,并提供灵活的算力访问)。

为什么现在讲

两个完全不同用户群(开发者 / 科研者)的产品同天发布,创作者可以拼成「Anthropic 一日双发」,也可以单独拆两条。

推荐理由

Sonnet 5 主打 agentic 与 coding,Claude Science 主打科研者工作流,两个都有 first-party 元描述,引用安全。

依据

前沿模型「agentic 化」是常青话题,科研 AI 是 niche 但黏性强的子话题,同天发布形成完整叙事。

Anthropic 同一天发了 Claude Sonnet 5 和 Claude Science,把 agentic 和科研工作台都摆上桌。

切入角度

把「Sonnet 5 是给开发者的」与「Claude Science 是给科研者的」拆成两条线,而不是混在一起。

形式

长视频讲解

演示想法

选 1 个真实编程任务演示 Sonnet 5 的 agentic 行为(例如多文件重构 + 测试),再选 1 个公开论文(arXiv)演示 Claude Science 的 artifacts 与工具集成。

平台注意

始终把「最 agentic」「顶级智能」归为 Anthropic 自家定位,不要替它宣称独立基准。 引用 Claude Science 时不要自造具体工具或包名(meta 没列),固定链到 Anthropic 官方文章。 不混「开发者 agentic」与「科研者工作流」两条线,避免把科研 demo 说成 coding demo。

可用说法

  • Anthropic 于 2026 年 6 月 30 日发布 Claude Sonnet 5,描述为「我们迄今最具 agentic 能力的 Sonnet,在 coding 与日常专业工作上提供顶级智能」。
  • Anthropic 于 2026 年 6 月 30 日发布 Claude Science,一个可定制的科研 app,集成研究者最常用的工具与包,产出可审计 artifacts,并提供灵活的算力访问。
  • Anthropic 的 Frontier Red Team 通过压力测试 AI 系统,理解其当前能力的全部范围并预判下一步,提供基于证据的 AI 影响分析。

证据链

拆解

这份拆解把 6/30 一天的两个 Anthropic 发布按用户群(开发者 / 科研者)分开讲:Sonnet 5 主打 agentic 与 coding,Claude Science 主打科研 app 与可审计 artifacts。同时把 Frontier Red Team 当作背景,说明 Sonnet 5 的 agentic 升级放在 Anthropic 整体安全叙事里。每条引用归到 Anthropic 自家定位,不替它宣称独立基准。

风险

  • 把「最 agentic」「顶级智能」归于 Anthropic 自家公告,不要替它宣称独立基准结果。

演示思路

  • 用 Sonnet 5 重构一个真实 GitHub 仓库的多文件 bug,展示 agentic 多步行为
  • 把一份 arXiv 论文 PDF 丢进 Claude Science,对比单纯传 PDF 问 Sonnet 5 与通过 Claude Science 调工具的分析差异
  • 引用 Frontier Red Team 的「压力测试当前能力」原文,把 Sonnet 5 的 agentic 升级放进 Anthropic 整体安全叙事