Z.ai выпустили GLM-5.1 — новый opensource флагман для агентных задач
Z.ai представила GLM-5.1 — новую открытую флагманскую модель для агентных задач и сложного программирования. Компания делает акцент на long-horizon сценариях, где модели нужно не просто ответить на запрос, а долго удерживать контекст, планировать шаги и доводить задачу до результата.
По заявлению Z.ai, GLM-5.1 входит в топ-3 глобально и занимает первое место среди open-source моделей на SWE-Bench Pro. Также компания отдельно выделяет сильные результаты на Terminal-Bench 2.0 и NL2Repo, то есть в задачах, связанных с реальной работой в терминале и генерацией кода на уровне репозитория.
Один из показательных сценариев, который приводит Z.ai, — автономная сборка Linux-десктопа прямо в браузере. По описанию компании, за восемь часов модель последовательно собрала рабочее окружение с файловым менеджером, терминалом, текстовым редактором и системным монитором. После каждого этапа она сама оценивала результат и решала, что нужно делать дальше.
С практической точки зрения это важный сигнал. Z.ai продвигает GLM-5.1 не как обычную чат-модель для коротких ответов, а как инструмент для длительных агентных циклов, где системе нужно наблюдать, проверять промежуточный результат и продолжать работу без постоянного вмешательства человека.
Веса модели уже доступны на Hugging Face, а лицензия указана как MIT. Это делает релиз заметным для разработчиков, которым нужен открытый флагман не только для экспериментов, но и для встраивания в собственные агентные пайплайны и инженерные инструменты.