Claude Opus 4.8 surpasse GPT-5.5 dans les derniers tests de référence sur l'IA

Table des matières Anthropic a présenté Claude Opus 4.8, qui représente le système d'IA le plus avancé de l'entreprise à ce jour, désormais accessible dans le monde entier. Cette version s'appuie sur Opus 4.7 avec des améliorations notables en matière de génération de code, de raisonnement logique et de véracité. Présentation de Claude Opus 4.8 : il s'appuie sur l'Opus 4.7 avec un jugement plus aiguisé, plus d'honnêteté quant à ses propres progrès et la capacité de travailler de manière indépendante plus longtemps que ses prédécesseurs. Disponible aujourd'hui au même prix. pic.twitter.com/EufxL7T1kb — Claude (@claudeai) 28 mai 2026 Les évaluations de référence menées par Anthropic démontrent qu'Opus 4.8 offre des résultats supérieurs par rapport au GPT-5.5 d'OpenAI et au Gemini 3.1 Pro de Google dans plusieurs catégories de tests. Le modèle excelle particulièrement dans les tâches de codage autonomes, l'analyse de données financières et les scénarios d'interaction informatique. L'IA autonome décrit une technologie capable d'exécuter des opérations complexes avec une surveillance humaine minimale. Cette capacité gagne en importance à mesure que les organisations intègrent des agents basés sur l’IA dans leurs flux de travail. Parmi les fonctionnalités les plus notables figure l'introduction de contrôles d'ajustement de l'effort, désormais disponibles via Claude.ai et Claude Cowork. Cette fonctionnalité permet aux utilisateurs de réguler les ressources de calcul allouées à des requêtes spécifiques. Lors du traitement de requêtes simples, les utilisateurs peuvent réduire l'intensité du traitement afin d'économiser du temps et des unités de calcul. À l’inverse, les projets difficiles peuvent bénéficier d’une puissance de traitement accrue pour une analyse plus approfondie. Les unités de calcul servent de norme de mesure utilisée par les services d’IA pour quantifier les entrées et les sorties. Chaque interaction avec un système d'IA consomme ces unités, quelle que soit la complexité, des questions de base aux demandes de programmation sophistiquées. La réduction de l’intensité du traitement se traduit par une réduction de la consommation unitaire, ce qui pourrait potentiellement diminuer les dépenses des organisations ayant des volumes d’utilisation élevés. Concernant les améliorations de fiabilité, l'Opus 4.8 démontre une amélioration de 400 % dans l'identification des erreurs de codage par rapport à l'Opus 4.7. Cela représente une mise à niveau substantielle pour les développeurs de logiciels déployant le modèle dans des systèmes de production en direct. La société dévoile simultanément une version expérimentale des flux de travail dynamiques au sein de Claude Code. Cette capacité permet la coordination de centaines de sous-processus simultanés pour gérer de vastes projets de migration de code. Le système a également été affiné pour une plus grande transparence. Selon Anthropic, le modèle reconnaîtra les limites de son analyse et s'abstiendra de présenter des informations non fondées. Les opérations en mode rapide sont devenues nettement plus économiques. Les coûts d'exploitation ont diminué de 66 % tout en maintenant le taux publié de 10 $ par million de jetons d'entrée et de 50 $ par million de jetons de sortie pour les utilisateurs finaux. La tarification du niveau standard reste cohérente, à 5 $ par million de jetons d'entrée et à 25 $ par million de jetons de sortie. L'introduction d'Opus 4.8 coïncide avec des informations selon lesquelles Anthropic finaliserait un cycle de financement pré-IPO dépassant 30 milliards de dollars. Cet investissement pourrait établir une valorisation de l’entreprise dépassant les 900 milliards de dollars. Bien qu'Anthropic n'ait pas officiellement annoncé son intention d'entrer en bourse, des sources du secteur suggèrent une éventuelle entrée en bourse en 2026. Ce calendrier correspond à des préparatifs comparables en cours chez OpenAI et SpaceX, qui envisagent tous deux des offres publiques. Créé par d'anciens membres de l'équipe OpenAI, Anthropic s'est imposé comme un acteur majeur du secteur de l'intelligence artificielle. Découvrez les actions les plus performantes dans les domaines de l'IA, de la cryptographie et de la technologie grâce à une analyse d'experts.