Le GPT-5.5 d'OpenAI correspond à Claude Mythos en termes de capacités de cyberattaque : AI Security Institute

En bref

GPT-5.5 peut exécuter de manière autonome des cyberattaques sophistiquées, réalisant une simulation de réseau d'entreprise en 32 étapes et résolvant un casse-tête de sécurité de 12 heures en seulement 10 minutes.

Les capacités cybernétiques offensives de l’IA s’améliorent rapidement parmi les développeurs, l’AISI avertissant que de nouvelles avancées pourraient arriver rapidement.

Les chercheurs ont découvert un jailbreak qui contournait entièrement les garde-fous de sécurité de GPT-5.5, déclenchant ainsi l'alarme.

Une agence gouvernementale britannique a découvert que le nouveau modèle d'intelligence artificielle d'OpenAI peut mener de manière autonome des cyberattaques complexes et qu'il a résolu un défi de rétro-ingénierie en un peu plus de 10 minutes, ce qui a pris environ 12 heures à un expert en sécurité humaine.

L'AI Security Institute (AISI), un organisme de recherche du ministère britannique des Sciences, de l'Innovation et de la Technologie, a publié jeudi des résultats montrant que GPT-5.5 est l'un des modèles les plus puissants qu'il ait évalués pour ses cybercapacités offensives, le plaçant à peu près à égalité avec le tant vanté Claude Mythos d'Anthropic.

Le rapport révèle que GPT-5.5 est le deuxième modèle à réaliser le test le plus exigeant d'AISI – une attaque de réseau d'entreprise simulée en 32 étapes appelée « The Last Ones » – en le faisant de manière autonome dans deux tentatives sur 10. Le premier modèle à franchir cette étape a été Claude Mythos Preview d'Anthropic, qui a réalisé la simulation en trois essais sur 10.

La simulation de réseau d'entreprise, construite avec la société de cybersécurité SpecterOps, nécessite qu'un agent enchaîne la reconnaissance, le vol d'identifiants, les mouvements latéraux à travers plusieurs forêts Active Directory, un pivot de la chaîne d'approvisionnement via un pipeline CI/CD et, finalement, l'exfiltration d'une base de données interne protégée – des étapes qui, selon l'AISI, prendraient environ 20 heures à un expert humain.

Le résultat le plus frappant a peut-être été un casse-tête de rétro-ingénierie extrêmement difficile. GPT-5.5 a résolu le défi, qui nécessitait de reconstruire le jeu d'instructions d'une machine virtuelle personnalisée, d'écrire un désassembleur à partir de zéro et de récupérer un mot de passe cryptographique grâce à la résolution de contraintes, en 10 minutes et 22 secondes, pour un coût de 1,73 $ en utilisation de l'API. Un expert humain, utilisant des outils professionnels, a nécessité environ 12 heures.

Sur la batterie de tâches avancées de cybersécurité d'AISI, GPT-5.5 a atteint un taux de réussite moyen de 71,4 % sur le niveau « Expert » le plus difficile, devançant Mythos Preview à 68,6 % et dépassant largement GPT-5.4 à 52,4 %.

Les résultats ont des implications pointues pour la trajectoire plus large du développement de l’IA. L'AISI a conclu que les performances de GPT-5.5 suggèrent que l'amélioration rapide des cybercapacités pourrait faire partie d'une tendance générale plutôt que d'une percée isolée - et a averti que si les cybercompétences offensives émergent comme un sous-produit d'améliorations plus larges dans le raisonnement, le codage et l'exécution autonome de tâches, alors d'autres progrès pourraient survenir rapidement.

Le rapport fait également état de préoccupations importantes concernant les garde-corps de sécurité du modèle. Les chercheurs ont identifié un jailbreak universel qui provoquait du contenu nuisible dans toutes les cyber-requêtes malveillantes testées, y compris dans des environnements agents multi-tours. L’attaque a nécessité six heures de travail d’équipe rouge experte pour se développer. OpenAI a ensuite mis à jour sa pile de sauvegarde, même si un problème de configuration a empêché AISI de vérifier si la version finale était efficace.

L'AISI a averti que ses évaluations de capacités ont été menées dans un environnement de recherche contrôlé et ne reflètent pas nécessairement ce qui est accessible à un utilisateur ordinaire, notant que les déploiements publics incluent des garanties et des contrôles d'accès supplémentaires.

Le rapport tombe dans un contexte inquiétant pour la cybersécurité britannique. L'enquête annuelle du gouvernement britannique sur les violations de la cybersécurité, également publiée jeudi, révèle que 43 % des entreprises ont subi une cyberattaque ou une cyberattaque au cours des 12 derniers mois.

En réponse, le gouvernement a annoncé un nouveau financement de 90 millions de livres sterling pour renforcer la cyber-résilience et a déclaré qu'il allait de l'avant avec le projet de loi sur la cybersécurité et la résilience pour protéger les services essentiels. Les responsables ont également publié des directives exhortant les organisations à se préparer à une éventuelle augmentation des vulnérabilités logicielles nouvellement découvertes, à mesure que l'IA accélère le rythme auquel les failles de sécurité peuvent être découvertes et utilisées comme arme.