疯狂星期四 $999 俱乐部 Vibe Hacks

排行榜成就设置

GLM-5.1：迈向长时程任务的SOTA编码与Agent模型 | VibeCafé

/帖子

阴明@kalasoo

·2026-04-08

GLM-5.1：迈向长时程任务的SOTA编码与Agent模型

顶级编码性能：SWE-Bench Pro达58.4%，超越GLM-5（55.1%）、GPT-5.4（57.7%）等多款顶尖模型；在NL2Repo和Terminal-Bench 2.0上也显著领先。
长时程优化能力：在数百至上千次迭代中持续提升性能（如VectorDBBench达21.5k QPS，KernelBench实现3.6×加速），而GLM-5易早早 plateau。
强Agent持久性：支持8小时以上复杂真实任务（如自主构建Linux桌面并迭代完善功能），展现出色自我评估与长周期精炼能力

→ https://z.ai/blog/glm-5.1

登录后评论

暂无评论

Vibe 作品

TokenNav - AI API 中转站导航

帮你找到最合适的 AI API 中转站。收录 OpenAI GPT、Claude、Gemini 等模型，支持按计费方式、模型、价格筛选对比，一站搞定。

Skills Spotlight

每一个Skill，都有自己的品牌

GitHub - chentao4183/StepMark: Windows 桌面截图批注工具，对标 Snipaste。核心特性：智能标注工具 —— 一步生成「红框 + 箭头 + 文字标签」组合。基于 Tauri 2 + React + Konva.js。

Windows 桌面截图批注工具，对标 Snipaste。核心特性：智能标注工具 —— 一步生成「红框 + 箭头 + 文字标签」组合。基于 Tauri 2 + React + Konva.js。 -

Keep Creating, Keep the Vibe!