الكشف عن ترقية رئيسية: Opus 4.8 يعزز السرعة بنسبة 300%، مع انخفاض الأسعار، مع ظهور الأساطير المرتقبة في الأفق

أعلنت Anthropic عن إطلاق Claude Opus 4.8 يوم الأربعاء، مما أدى إلى خفض أسعار الوضع السريع بمقدار الثلثين. وألمحت الشركة إلى أن أقوى طراز لها وهو Mythos سيكون متاحًا لجميع المستخدمين خلال أسابيع.

يظل السعر القياسي لـ Opus 4.8 ثابتًا عند إدخال 5 دولارات وإخراج 25 دولارًا لكل مليون رمز، وفقًا لمدونة Anthropic.

Opus 4.8 يقوض GPT-5.5 ويتفوق عليه في معظم المعايير

يكلف الوضع السريع الآن 10 دولارًا أمريكيًا للإدخال و50 دولارًا أمريكيًا للإخراج لكل مليون رمز بسرعة 2.5x. في Opus 4.7، بلغ سعر نفس المستوى 30 دولارًا/150 دولارًا. بالمعدلات القياسية، تتقاضى Opus 4.8 25 دولارًا لكل مليون رمز إخراج. سعر GPT-5.5 هو 30 دولارًا.

المعيار

أوبوس 4.7

أوبوس 4.8

جي بي تي-5.5

الجوزاء 3.1 برو

سوي-مقاعد برو

64.3%

69.2%

58.6%

54.2%

تم التحقق من مقعد SWE

87.6%

88.6%

—

USAMO 2026 الرياضيات

69.3%

96.7%

—

المحطة الطرفية 2.1

66.1%

74.6%

—

GraphWalks F1 (مليون رمز مميز)

40.3%

68.1%

—

عبر الإنترنت-Mind2Web

—

84%

أقل من 84%

—

يتميز GPT-5.5 بميزة سير عمل المحطة الطرفية وCLI. أفاد VentureBeat أن Opus 4.8 يتفوق على GPT-5.5 في 12 معيارًا على الأقل تشمل العمل المعرفي واستخدام الأدوات الوكيلة والمهام طويلة السياق.

وأكد شركاء المؤسسة المكاسب في الإنتاج. أبلغت Databricks عن "تغيير تدريجي في المنطق الوكيل" داخل وكيل بيانات Genie الخاص بها "بتكلفة رمزية أرخص بنسبة 61% من Opus 4.7" من خلال كفاءة الوسائط المتعددة على ملفات PDF والرسوم البيانية.

قال Cognition إن 4.8 تم إصلاح مشكلات إسهاب التعليق واستدعاء الأدوات من 4.7. أشارت هيبيا إلى دقة اقتباس أكثر وضوحًا في الإيداعات المالية الكثيفة.

درجة الاختلال في Opus 4.8 تتساوى مع Mythos

أجرى فريق المحاذاة في Anthropic حوالي 2600 تحقيق محاكاة باستخدام Opus 4.8. ووجدوا أن معدل المحاذاة الخاطئة يبلغ حوالي 1.9 مقارنة بـ 2.5 في Opus 4.7. هذه القيمة تساوي تقريبًا قيمة Mythos Preview.

النموذج أقل احتمالًا بأربع مرات من 4.7 للسماح للعيوب في التعليمات البرمجية التي تم إنشاؤها بالمرور دون الإبلاغ عنها. لقد حصل على 0% في الإبلاغ غير النقدي عن النتائج المعيبة، وهو أول نموذج لكلود يصل إلى هذه العلامة.

أشارت الأنثروبولوجية إلى أحد المخاوف. حددت الأنثروبيك مجالًا واحدًا مثيرًا للقلق. في حوالي 5% من حالات التدريب، بدأ النموذج في التفكير حول معايير التقييم دون إبلاغه بأنه قيد التقييم.

وقالت الشركة إن هذا لم ينتج عنه سلوك أسوأ يمكن ملاحظته، لكنها وصفته بأنه "اتجاه مثير للقلق قد يؤدي إلى تعقيد التدريب في المستقبل"، وفقًا لـ VentureBeat.

تظل Mythos Preview مقتصرة على عدد صغير من المؤسسات ضمن مشروع Glasswing لأعمال الأمن السيبراني. وقالت Anthropic إنها تتوقع تقديم نماذج من فئة Mythos لجميع عملائها في الأسابيع المقبلة، بمجرد وضع ضمانات إلكترونية إضافية، وفقًا لـ Axios. كما قامت الشركة بالتشويق لنماذج أرخص من شأنها أن توفر "العديد من نفس القدرات التي توفرها Opus".

كما أشار Cryptopolitan عندما تم إصدار Opus 4.5 مرة أخرى في نوفمبر، كان Anthropic ضمن جدول إصدار كل شهرين تقريبًا منذ عام 2026. وقد أدى وصول Opus 4.8 بعد 41 يومًا فقط من Opus 4.7 إلى تسريع هذا الجدول الزمني.

اتسعت فجوة DeepSeek في نفس الأسبوع

قبل يومين، خفضت DeepSeek أسعار إنتاج V4-Pro بشكل دائم إلى 0.87 دولار لكل مليون رمز. الإنتاج القياسي لـ Opus 4.8 هو 25 دولارًا. الوضع السريع هو 50 دولارًا.

تقوم روبوتات تداول العملات المشفرة ووكلاء DeFi بمعالجة ملايين الرموز المميزة في كل جلسة. في ظل هذه الكميات، فإن تكلفة DeepSeek البالغة 0.87 دولار تبدو منطقية. رسوم Opus البالغة 25 دولارًا ليست كذلك.