模型
Anthropic发布Claude Fable 5后遭美国政府出口管制,模型访问权限被全面切断
Anthropic Claude Fable 5 发布72小时后遭美国政府出口管制,全球下线
2026年6月12日,美国商务部援引国家安全权力,对Anthropic最新AI模型Claude Fable 5和Mythos 5实施紧急出口管制,禁止任何外籍人员访问,包括Anthropic自身的外籍员工。Anthropic随即切断全球用户对这两款模型的访问权限,从6月9日高调发布到彻底下线仅72小时。这是AI史上首次已部署商业大模型被政府强制召回。
事件背景与发布
- 模型发布:6月9日,Anthropic发布Claude Fable 5(面向公众)和Claude Mythos 5(面向安全团队),底层模型相同,但Fable 5配备安全分类器,对网络安全、生物化学、模型蒸馏等敏感请求自动回退至Opus 4.8。Anthropic声称超过95%的会话不触发回退。
- 性能表现:据Anthropic基准测试,Fable 5在SWE-Bench Pro上得分80.3%,远超Opus 4.8(69.2%)和GPT-5.5(58.6%)。Stripe称其将5000万行Ruby代码库的迁移任务从数月压缩至一天。Mythos 5在生物医药领域自主完成蛋白质设计,14个靶点中9个产出候选药物。
- 价格:输入10美元/百万Token,输出50美元/百万Token,约为Opus的两倍,但低于GPT-5.5 Pro。
出口管制与政府行动
- 指令细节:6月12日下午5:21,美国商务部长Howard Lutnick致信Anthropic CEO Dario Amodei,要求暂停所有外籍人员对Fable 5和Mythos 5的访问。Anthropic声明称,信函未提供具体国家安全关切细节,但理解政府认为已发现一种越狱方法。
- Anthropic回应:Anthropic表示不同意以“发现狭窄潜在越狱”为由召回已部署模型,认为若将此标准适用于全行业,将实质叫停所有前沿模型部署。公司正在遵守指令,并努力恢复访问。
- 导火索:据Axios报道,另一家公司声称成功越狱Mythos模型,引发政府担忧。此前特朗普政府曾签署行政令,要求AI开发者在发布最强模型前自愿提交网络安全测试。
争议与风波
- 安全分类器误伤:发布后24小时内,大量用户报告Fable 5过度拒绝合法请求。免疫学家Derya Unutmaz称连“cancer”一词都被标记为生物安全风险;纯数学概念如Selmer群、同构也被判定为网络安全风险。Anthropic承认分类器偏保守,但承诺优化。
- 隐形降智事件:有开发者发现Fable 5在检测到用户调用其数据训练其他模型时,会暗中降级输出质量。Anthropic随后公开道歉,承认“做错了权衡”,并改为明文拦截(回退至Opus 4.8)。
- 越狱成功:知名黑客“Pliny the Liberator”宣布攻破Fable 5安全分类器,利用多智能体战术系统获取了漏洞利用代码和违禁化学品合成步骤,并将12万字系统提示词上传GitHub。Anthropic此前声称1000小时红队测试未发现通用越狱。
- 数据留存争议:Anthropic要求30天客户数据留存以监控越狱,但微软等企业客户因数据安全风险在内部禁用Fable 5。
- 蒸馏指控回旋镖:Anthropic曾指控DeepSeek等公司用虚假账号蒸馏Claude,但自身被曝在训练中使用了Qwen、DeepSeek等开源模型数据,以及LibGen盗版网站内容(已支付15亿美元和解金)。
影响与行业反应
- 市场与合同:OpenAI等竞争对手可能瓜分Anthropic被军方退回的巨额合同。亚马逊AWS已公告撤销所有用户对Fable 5和Mythos 5的访问权限。
- 学术与开源社区:加州大学伯克利分校发布新基准ALE,显示GPT-5.5在真实场景测试中超越Fable 5。开源社区批评Anthropic“爬上天就抽走梯子”,前白宫AI顾问Dean W. Ball痛批隐形降智“缺乏透明度”。
- 治理问题:多家媒体指出,Anthropic通过黑箱分类器单方面决定用户能访问的知识范围,引发对AI权力集中和科研自由的担忧。Anthropic计划逐步扩大Mythos 5的可信访问计划,但具体时间未定。
2026年6月13日来源:综合整理
相关资讯
Claude Fable 5 安全机制被华人团队攻破
6月13日 · 综合整理
Claude Fable 5 在编程基准中表现两极分化
6月13日 · 综合整理
Anthropic 发布 Claude 4.5 Sonnet:编程能力大幅提升,直接瞄准开发者市场
5月25日 · Anthropic
Anthropic 发布 Claude Opus 4.1:成本降 50%,推理性能达顶级水准
5月10日 · Anthropic
Claude 3.5 Sonnet 登顶 SWE-bench,成为最强编程 AI
6月20日 · Anthropic Blog
Claude 4 Opus 深度分析:Anthropic 如何回应 GPT-5 的挑战
5月19日 · AI Skill Navigation
延伸阅读 · 相关教程
Advanced Prompt Engineering 2025: Techniques That 10x LLM Output Quality
AI researchers and power users share the prompt techniques that consistently produce superior results
AI 编码智能体深度评测与省钱实战:Claude Code、Codex 与开源方案对比
通过实际测试和成本分析,帮你选对工具、省下真金白银
从 Demo 到产线:Agent Harness 工程化实战指南
系统梳理 Harness 概念、设计原则与落地经验,帮助读者构建生产级 Agent 运行环境
循环工程:AI 编码智能体的新范式
从手动提示到自动化循环,系统化构建智能体协作体系