6 月 9 日,Anthropic 发布了 Claude Fable 5,这是第一个对公众开放的 Mythos 级模型。
Mythos 模型是在今年 4 月由 Anthropic 推出的一个模型,由于其强大的网络安全能力,最初仅限于极少数合作伙伴使用。Fable 5 与 Mythos 基于同一底座模型,命名上体现了两者的关系:寓言是能够讲给所有人听的神话,与 Mythos 同源。

Fable 5 在网络安全和生物化学等高危领域增加了护栏,其余能力则保持不变。同一天发布的未加护栏的 Mythos 5 仍然只对极少数用户开放。
性能指标:全面超越
基本参数:上下文长度为 100 万 tokens(1M),支持文本、图像和文件输入,API 模型名为 claude-fable-5。

SWE-Bench Pro 的评分如下:
| 模型 | SWE-Bench Pro | FrontierCode |
|---|---|---|
| Claude Fable 5 | 80.3% | 29.3% |
| Claude Opus 4.8 | 69.2% | 13.4% |
| GPT-5.5 | 58.6% | 5.7% |
| Gemini 3.1 Pro | 54.2% | — |
FrontierCode 是 Cognition 出品的一个高难度生产级编码基准。Fable 5 在这一基准上的得分是 Claude Opus 4.8 的两倍多,也是 GPT-5.5 的五倍。
在知识工作基准 GDPval-AA 上,Fable 5 得分为 1932,而 Opus 为 1890,显示出显著的优势。这个差距已经不仅仅是“领先”,而是代表了技术上的重大突破。
Fable 5 在 CursorBench 上创下了 72.9% 的新技术水平,比之前的最高水平高出 8 个百分点。

为什么发布 Fable 5?
尽管 Claude Opus 4.8 不久前才发布,但 Fable 5 并不是它的升级版,而是定位更高的一个版本。Anthropic 的产品线现在包括 Haiku → Sonnet → Opus → Mythos 级(Fable / Mythos)。
官方表示,Fable 5 的能力超过了之前公开发布的任何模型,并且在几乎所有测试过的基准上都达到了当前的最佳水平。按公开可用的模型计算,它在多个方面表现出色。
实际应用场景测试
01 超长工程任务
Stripe 使用 Fable 5 在 5000 万行的 Ruby 代码库中进行迁移,原本需要一个团队两个多月的工作量,Fable 5 仅用一天就完成了。Stripe 表示,这项任务从五个月压缩到了几天。
02 视觉理解
Fable 5 只需游戏截图就能通关宝可梦火红,而之前的模型需要外挂框架和地图数据。此外,它还能从截图反推出整个 Web 应用的源码。
03 长程专注
Fable 5 能够跨百万 tokens 保持注意力,并通过记笔记来提升结果。数据分析公司 Hex 称它是第一个在其复杂长任务分析基准上达到 90 分的模型。
安全分类器的影响
Fable 5 加入了一套新的安全分类器,覆盖网络安全、生物化学和蒸馏等领域。触发机制是,在涉及这些领域的请求时,系统会切换到 Opus 4.8 来回答。
官方称 95% 以上的会话完全不受影响,但也承认目前分类器调得较为保守,可能会误伤一些无害请求。在官方基准表上带星号的项目(如网络安全、生物等),展示的是 Mythos 5 的分数,而实际使用的 Fable 5 在这些领域会回落到 Opus 4.8 的水平。
这意味着,当问及某些安全类问题时,Claude 会切换为 Opus 模型来回答。但大部分功能仍然保持高水平。
任何生物学的基础知识也无法询问,例如“线粒体是什么”这种初中生物的问题也不行,研究生物医药的用户只能申请使用 Mythos。
Token 用量和价格
Claude Fable 5 已经在 Claude 桌面版中可用。
消耗:在 Claude 套餐中,Fable 5 按 2 倍用量计,即同样的额度,使用 Fable 5 只能完成 Opus 一半的任务量。它推理更深、单个任务消耗的 tokens 也更多,重度用户很快就会用完额度。

时间点:6 月 22 日前,Pro / Max / Team 套餐用户可以免费使用;6 月 23 日起,Fable 5 将从套餐中移除,需要单独购买用量积分。官方表示未来订阅用户可能也能使用,但具体细节尚未确定。
API 价格也是 Opus 4.8 的两倍。
拥有 Pro 和以上订阅的用户可以在 6 月 22 日前试用 Fable 5。