Anthropic представила Claude Mythos Preview, но сразу заявила, что выпускать эту модель в публичный доступ пока не собирается. Причина — кибербезопасность. В официальном анонсе компания пишет, что модель уже нашла тысячи ранее неизвестных уязвимостей, включая критические проблемы в крупных операционных системах, браузерах и другом важном ПО.
Среди примеров Anthropic приводит 27-летнюю уязвимость в OpenBSD, 16-летнюю проблему в FFmpeg и цепочку уязвимостей в Linux kernel, которая позволяла повышать привилегии до полного контроля над машиной. Компания утверждает, что часть таких багов пережила годы человеческих проверок и миллионы автоматических тестов.
По словам Anthropic, Mythos Preview умеет не только находить уязвимости, но и строить эксплойты почти автономно. Именно поэтому компания считает прямой релиз слишком рискованным: такие возможности, по ее оценке, уже сопоставимы с уровнем лучших специалистов по offensive security и могут быть опасны в открытом доступе.
Вместо публичного релиза Anthropic запустила Project Glasswing — закрытую программу для defensive cybersecurity. В нее вошли AWS, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, Palo Alto Networks, Linux Foundation и другие крупные участники. Им дадут доступ к модели для поиска и закрытия уязвимостей в критической инфраструктуре и open-source проектах. На программу выделено до 100 миллионов долларов в виде usage credits, а еще 4 миллиона долларов — в виде прямых пожертвований open-source security-организациям.
По бенчмаркам Mythos Preview действительно сильно опережает Claude Opus 4.6, но в исходном пересказе цифры были неточными. В официальном анонсе указаны такие результаты: CyberGym — 83,1% против 66,6%, SWE-bench Pro — 77,8% против 53,4%, Terminal-Bench 2.0 — 82,0% против 65,4%. То есть разрыв большой, но не такой, как в присланном тексте.

Сроков публичного релиза Anthropic не называет. Наоборот, компания прямо пишет, что сначала хочет выстроить защитные механизмы и использовать модель в закрытом оборонительном контуре, а уже потом постепенно переносить часть этих возможностей в более безопасные публичные модели.