Claude Fable 5 发布

宾果软件 . 发布于 2026-06-17 17:55:20 . 阅读 3

6 月 9 日,Anthropic 发布了 Claude Fable 5,这是第一个对公众开放的 Mythos 级模型。


Mythos 模型是在今年 4 月由 Anthropic 推出的一个模型,由于其强大的网络安全能力,最初仅限于极少数合作伙伴使用。Fable 5 与 Mythos 基于同一底座模型,命名上体现了两者的关系:寓言是能够讲给所有人听的神话,与 Mythos 同源。



Fable 5 在网络安全和生物化学等高危领域增加了护栏,其余能力则保持不变。同一天发布的未加护栏的 Mythos 5 仍然只对极少数用户开放。


性能指标:全面超越


基本参数:上下文长度为 100 万 tokens(1M),支持文本、图像和文件输入,API 模型名为 claude-fable-5。


图像


SWE-Bench Pro 的评分如下:
































模型SWE-Bench ProFrontierCode
Claude Fable 580.3%29.3%
Claude Opus 4.869.2%13.4%
GPT-5.558.6%5.7%
Gemini 3.1 Pro54.2%

FrontierCode 是 Cognition 出品的一个高难度生产级编码基准。Fable 5 在这一基准上的得分是 Claude Opus 4.8 的两倍多,也是 GPT-5.5 的五倍。


在知识工作基准 GDPval-AA 上,Fable 5 得分为 1932,而 Opus 为 1890,显示出显著的优势。这个差距已经不仅仅是“领先”,而是代表了技术上的重大突破。


Fable 5 在 CursorBench 上创下了 72.9% 的新技术水平,比之前的最高水平高出 8 个百分点。


图像


为什么发布 Fable 5?


尽管 Claude Opus 4.8 不久前才发布,但 Fable 5 并不是它的升级版,而是定位更高的一个版本。Anthropic 的产品线现在包括 Haiku → Sonnet → Opus → Mythos 级(Fable / Mythos)。


官方表示,Fable 5 的能力超过了之前公开发布的任何模型,并且在几乎所有测试过的基准上都达到了当前的最佳水平。按公开可用的模型计算,它在多个方面表现出色。


实际应用场景测试


01 超长工程任务


Stripe 使用 Fable 5 在 5000 万行的 Ruby 代码库中进行迁移,原本需要一个团队两个多月的工作量,Fable 5 仅用一天就完成了。Stripe 表示,这项任务从五个月压缩到了几天。


02 视觉理解


Fable 5 只需游戏截图就能通关宝可梦火红,而之前的模型需要外挂框架和地图数据。此外,它还能从截图反推出整个 Web 应用的源码。


03 长程专注


Fable 5 能够跨百万 tokens 保持注意力,并通过记笔记来提升结果。数据分析公司 Hex 称它是第一个在其复杂长任务分析基准上达到 90 分的模型。


安全分类器的影响


Fable 5 加入了一套新的安全分类器,覆盖网络安全、生物化学和蒸馏等领域。触发机制是,在涉及这些领域的请求时,系统会切换到 Opus 4.8 来回答。


官方称 95% 以上的会话完全不受影响,但也承认目前分类器调得较为保守,可能会误伤一些无害请求。在官方基准表上带星号的项目(如网络安全、生物等),展示的是 Mythos 5 的分数,而实际使用的 Fable 5 在这些领域会回落到 Opus 4.8 的水平。


这意味着,当问及某些安全类问题时,Claude 会切换为 Opus 模型来回答。但大部分功能仍然保持高水平。


任何生物学的基础知识也无法询问,例如“线粒体是什么”这种初中生物的问题也不行,研究生物医药的用户只能申请使用 Mythos。


Token 用量和价格


Claude Fable 5 已经在 Claude 桌面版中可用。


消耗:在 Claude 套餐中,Fable 5 按 2 倍用量计,即同样的额度,使用 Fable 5 只能完成 Opus 一半的任务量。它推理更深、单个任务消耗的 tokens 也更多,重度用户很快就会用完额度。



时间点:6 月 22 日前,Pro / Max / Team 套餐用户可以免费使用;6 月 23 日起,Fable 5 将从套餐中移除,需要单独购买用量积分。官方表示未来订阅用户可能也能使用,但具体细节尚未确定。


API 价格也是 Opus 4.8 的两倍。


拥有 Pro 和以上订阅的用户可以在 6 月 22 日前试用 Fable 5。