OpenAI GPT-5.5 соответствует Клоду Мифосу в возможностях кибератак: Институт безопасности искусственного интеллекта

Вкратце

GPT-5.5 может автономно выполнять сложные кибератаки, выполняя 32-этапное моделирование корпоративной сети и решая 12-часовую задачу безопасности всего за 10 минут.

Наступательные кибервозможности искусственного интеллекта быстро улучшаются среди разработчиков, и AISI предупреждает, что дальнейшие достижения могут появиться очень быстро.

Исследователи обнаружили побег из тюрьмы, который полностью обошел защитные ограждения GPT-5.5, что вызвало тревогу.

Правительственное агентство Великобритании обнаружило, что новейшая модель искусственного интеллекта OpenAI может автономно выполнять сложные кибератаки — и что она решила задачу обратного проектирования всего за 10 минут, на что у эксперта по безопасности человека ушло примерно 12 часов.

Институт безопасности искусственного интеллекта (AISI), исследовательский орган при Министерстве науки, инноваций и технологий Великобритании, в четверг опубликовал результаты, показывающие, что GPT-5.5 является одной из самых мощных моделей, которые он оценивал по наступательным кибервозможностям, что ставит ее примерно на один уровень с хваленым Claude Mythos от Anthropic.

В отчете говорится, что GPT-5.5 является второй моделью, прошедшей самый сложный тест AISI — 32-этапную симуляцию корпоративной сетевой атаки под названием «Последние» — сделав это автономно в двух из 10 попыток. Первой моделью, достигшей этого рубежа, стала Claude Mythos Preview от Anthropic, которая завершила симуляцию за три из 10 попыток.

Моделирование корпоративной сети, созданное совместно с фирмой SpectreOps, занимающейся кибербезопасностью, требует от агента объединить воедино разведку, кражу учетных данных, горизонтальное перемещение по нескольким лесам Active Directory, поворот цепочки поставок через конвейер CI/CD и, в конечном итоге, эксфильтрацию защищенной внутренней базы данных — шаги, которые, по оценкам AISI, заняли бы у эксперта-человека около 20 часов.

Пожалуй, самым поразительным результатом стала невероятно сложная задача, связанная с обратным проектированием. GPT-5.5 решил задачу — которая требовала реконструкции специального набора команд виртуальной машины, написания дизассемблера с нуля и восстановления криптографического пароля посредством решения ограничений — за 10 минут и 22 секунды, при затратах на использование API 1,73 доллара. Человеческому эксперту, использующему профессиональные инструменты, потребовалось около 12 часов.

В наборе сложных задач по кибербезопасности AISI GPT-5.5 достиг среднего показателя сдачи 71,4% на самом сложном уровне «Эксперт», опередив Mythos Preview с 68,6% и значительно превзойдя GPT-5.4 с 52,4%.

Полученные результаты имеют важное значение для более широкой траектории развития ИИ. AISI пришла к выводу, что производительность GPT-5.5 предполагает, что быстрое улучшение кибервозможностей может быть частью общей тенденции, а не изолированным прорывом, и предупредила, что если наступательные кибернавыки станут побочным продуктом более широких улучшений в рассуждении, кодировании и автономном выполнении задач, то дальнейшие достижения могут произойти в быстрой последовательности.

В отчете также отмечены серьезные опасения по поводу защитных ограждений модели. Исследователи выявили универсальный джейлбрейк, который извлекал вредоносный контент во всех протестированных вредоносных киберзапросах, в том числе в многооборотных агентских настройках. На разработку атаки ушло шесть часов работы экспертной команды красных. Впоследствии OpenAI обновила свой стек защитных мер, хотя проблема с конфигурацией не позволила AISI проверить, эффективна ли окончательная версия.

AISI предупредила, что ее оценки возможностей проводились в контролируемой исследовательской среде и не обязательно отражают то, что доступно обычному пользователю, отметив, что публичное развертывание включает дополнительные меры безопасности и контроля доступа.

Отчет написан на тревожном фоне для британской кибербезопасности. Ежегодный опрос правительства Великобритании по нарушениям кибербезопасности, также опубликованный в четверг, показал, что 43% предприятий пострадали от кибер-взломов или атак за последние 12 месяцев.

В ответ правительство объявило о новом финансировании в размере 90 миллионов фунтов стерлингов для повышения киберустойчивости и заявило, что продвигается вперед в разработке законопроекта о кибербезопасности и устойчивости для защиты основных услуг. Чиновники также опубликовали руководство, призывающее организации подготовиться к потенциальному всплеску вновь обнаруженных уязвимостей программного обеспечения, поскольку ИИ ускоряет темпы обнаружения и использования недостатков безопасности.