Беспрепятственный доступ к кодированию ИИ вызывает споры о границах надзора со стороны сообщества.

Согласно результатам тестирования Financial Times с группой безопасности искусственного интеллекта Alice, средства защиты моделей искусственного интеллекта с открытым исходным кодом от крупных технологических групп можно снять за считанные минуты с помощью общедоступных инструментов, что позволяет системам выдавать ответы по темам, включая биологическое оружие, вредоносное ПО и другой запрещенный контент.

Выводы, опубликованные в понедельник, усиливают опасения, что меры безопасности, встроенные разработчиками, могут не сохраниться после публикации и изменения весов моделей, что поднимает вопросы о том, на ком должна лежать ответственность за безопасность ИИ.

Расследование, проведенное с использованием инструментов, доступных в общедоступных репозиториях кода, показало, что ограждения на моделях, разработанных такими компаниями, как Meta и Google, можно снять менее чем за 10 минут без специального оборудования.

Согласно тестам, модифицированные версии систем затем смогли реагировать на запросы, от которых отказывались оригинальные модели, включая запросы, связанные с вредоносным ПО и химическими опасностями.

Результаты подчеркивают проблему, стоящую перед политиками, поскольку системы с открытым исходным кодом становятся более функциональными и широко распространенными.

В отличие от проприетарных моделей, системы с открытым исходным кодом можно загружать, изменять и распространять вне контроля их первоначальных разработчиков, что затрудняет соблюдение ограничений безопасности после выпуска и поднимает вопросы о том, достаточно ли регулирования, ориентированного в первую очередь на разработку моделей.

Ограничения управления

Глобальные регулирующие органы разрабатывают основы для передовых систем искусственного интеллекта, включая Закон Европейского Союза об искусственном интеллекте и новые передовые модели безопасности в Великобритании и США. Однако эксперты говорят, что результаты показывают ограничения в текущих предположениях в области управления.

Закон Европейского Союза об искусственном интеллекте. Источник: Европейская комиссия.

Маркус Левин, соучредитель компании XYO, занимающейся децентрализованной физической инфраструктурой, рассказал Cointelegraph, что быстрое снятие мер безопасности показывает, «насколько быстро меняется контроль после выпуска открытых моделей», добавив, что большинство предложений по управлению по-прежнему слишком сосредоточены на этапе построения моделей.

Дэвид Минарш, один из основателей Olas и исполнительный директор Valory, платформы агентов искусственного интеллекта, сказал Cointelegraph, что правительства вряд ли будут препятствовать решительным субъектам получать доступ к моделям или изменять их, как только веса будут широко отражаться в Интернете. Он сказал, что регулирование будет более эффективным, если оно будет сосредоточено на развертывании, распространении и вредном использовании в реальном мире, а не только на исходном уровне разработчиков.

Управление перемещается вниз по течению

Ронхуэй Гу, исполнительный директор и соучредитель CertiK, фирмы, занимающейся безопасностью блокчейнов, рассказал Cointelegraph, что управление на уровне разработчиков по-прежнему имеет значение, но становится недостаточным, когда модели можно свободно загружать и распространять.

Гу сказал, что политики скорее будут влиять на коммерческий хостинг, корпоративное развертывание и каналы распространения, чем полностью предотвращать распространение модифицированных моделей.

Он утверждал, что стандарты безопасности должны развиваться, чтобы выявлять вредоносное или высокорискованное поведение в сторонних инструментах ИИ и средах автономных агентов ИИ перед развертыванием, чтобы лучше сдерживать угрозы во время выполнения, поскольку агенты берут на себя более автономные роли.

Левин сказал, что сдерживание становится все более трудным, когда модели зеркалируются и перераспределяются, а это означает, что политикам, возможно, придется больше сосредоточиться на инфраструктуре и точках распространения, а не только на разработке моделей.

И Левин, и Минарш сравнили эту проблему с программным обеспечением с открытым исходным кодом и криптосетями, где попытки подавить распространение исторически оказались трудными, как только код становится общедоступным. Минарш добавил, что, хотя уровни безопасности могут сдерживать случайное злоупотребление, их не следует путать с надежной защитой от изощренных злоумышленников.