Mollick 提前获得了首个面向公众发布的 Mythos 级模型 Claude Fable 5 的使用权限。他的结论是,这个模型相比他用过的所有公开模型都有显著飞跃,而且更重要的是,它暗示着人类与 AI 的关系正在发生剧烈变化。
他在各种任务上测试了 Fable,发现它能执行长达十几个小时的多页规格说明。例子包括:一篇他认为是 AI 产出过的最复杂的社会科学学术论文、一首每个词都以字母 s 开头的十页押韵长诗,以及几个仅靠数学(不用任何外部素材)生成画面的小游戏。
他让 Fable 构建一张展示从各城市出发在给定时间内可到达范围的地图。以往没有任何模型能勉强完成这个任务。Fable 自己启动了多个子 AI(他猜测主要是更便宜的 Sonnet)做并行研究,检索了两千多条航班、各国铁路时刻表和道路速度数据,同时编写代码并派出更多智能体互相验证。当他要求修正偏远地区(如格陵兰)的估算数据时,它甚至查清了去皮特凯恩岛的船期。
他让 Fable 解决"校准人类与 AI 判断"这一研究方法难题。模型先写了一份 19 页的设计文档,然后连续工作了九个半小时,产出了一个名为 Concord 的复杂软件——这是研究者多年来需要但从未有人觉得值得开发的工具。
Fable 价格是 Opus 的两倍,token 消耗极快;安全护栏过于敏感,稍微触及安全话题就会降级到 Opus 4.8;写作风格仍带有明显的"Claude 腔"。
Mollick 去年把使用 AI 比作"与巫师共事"——念咒语,事情就发生了。但现在他觉得自己已经不再是巫师,而更像一位赞助人(patron):他描述需求、付钱、评判成果,而"施法"过程发生在他看不见的地方,包含数百个他从未参与的小决策。工作的重心从"过程"转向了"结果"——他不再"操作",而是"委托"。他甚至觉得 Fable 不像单个艺术家,更像一整个工作室,而他是那个从不踏进车间、只在最后签字验收的客户。他怀疑这种"人被边缘化"的趋势不是界面没跟上的暂时现象,而是能力越强的模型留给人类做的事就越少,黑箱可能就是力量的代价。

What it feels like to work with Mythos
Claude Fable represents another big jump in AI
oneusefulthing.org
登录后评论