بڑے اپ گریڈ کی نقاب کشائی: Opus 4.8 نے رفتار میں 300 فیصد اضافہ کیا، قیمتوں میں کمی کی گئی، جیسا کہ انتہائی متوقع Mythos لانچ افق پر ہے

Anthropic نے بدھ کے روز Claude Opus 4.8 کے اجراء کا اعلان کیا، جس سے فاسٹ موڈ کی قیمتوں میں دو تہائی کمی ہوئی۔ کمپنی نے اشارہ کیا کہ اس کا سب سے مضبوط ماڈل، Mythos، ہفتوں کے اندر تمام صارفین کے لیے دستیاب ہو جائے گا۔
Opus 4.8 کے لیے معیاری قیمتیں $5 ان پٹ اور $25 آؤٹ پٹ فی ملین ٹوکنز پر فلیٹ رہتی ہیں، فی Anthropic کے بلاگ۔
Opus 4.8 GPT-5.5 کو کم کرتا ہے اور اسے زیادہ تر بینچ مارکس پر مات دیتا ہے۔
فاسٹ موڈ کی قیمت اب 2.5x رفتار سے $10 ان پٹ اور $50 آؤٹ پٹ فی ملین ٹوکن ہے۔ Opus 4.7 پر، اسی درجے میں $30/$150 چلا۔ معیاری شرحوں پر، Opus 4.8 $25 فی ملین آؤٹ پٹ ٹوکن چارج کرتا ہے۔ GPT-5.5 $30 چارج کرتا ہے۔
بینچ مارک
اوپس 4.7
اوپس 4.8
GPT-5.5
Gemini 3.1 Pro
SWE بینچ پرو
64.3%
69.2%
58.6%
54.2%
ایس ڈبلیو ای بینچ کی تصدیق ہو گئی۔
87.6%
88.6%
-
-
USAMO 2026 ریاضی
69.3%
96.7%
-
-
ٹرمینل بنچ 2.1
66.1%
74.6%
-
-
GraphWalks F1 (1M ٹوکنز)
40.3%
68.1%
-
-
آن لائن مائنڈ 2 ویب
-
84%
84% سے نیچے
-
GPT-5.5 ٹرمینل اور CLI ورک فلو پر برتری رکھتا ہے۔ VentureBeat نے اطلاع دی ہے کہ Opus 4.8 GPT-5.5 کو کم سے کم 12 بینچ مارکس پر بہتر کارکردگی دکھاتا ہے جس میں علمی کام، ایجنٹی ٹول کے استعمال، اور طویل سیاق و سباق کے کام شامل ہیں۔
انٹرپرائز کے شراکت داروں نے پیداوار میں اضافے کی تصدیق کی۔ ڈیٹابرکس نے اپنے جنی ڈیٹا ایجنٹ کے اندر پی ڈی ایف اور ڈائیگرامس پر ملٹی موڈل کارکردگی کے ذریعے "Opus 4.7 کے مقابلے میں 61% سستی ٹوکن لاگت" میں "ایجنٹک استدلال میں ایک قدم تبدیلی" کی اطلاع دی۔
کوگنیشن نے کہا کہ 4.7 سے 4.8 فکسڈ کمنٹ-وربوسٹی اور ٹول کالنگ ایشوز۔ ہبیہ نے گھنے مالیاتی فائلنگز پر تیز اقتباس کی درستگی کا حوالہ دیا۔
Opus 4.8 کے لیے Misalignment اسکور Mythos کے برابر ہے۔
اینتھروپک میں الائنمنٹ ٹیم نے Opus 4.8 کا استعمال کرتے ہوئے تقریباً 2,600 نقلی تحقیقات کیں۔ انہوں نے Opus 4.7 پر 2.5 کے مقابلے میں غلط ترتیب کی شرح تقریباً 1.9 پائی۔ یہ قدر تقریباً Mythos Preview کے برابر ہے۔
ماڈل کے 4.7 سے چار گنا کم امکان ہے کہ اس کے اپنے تیار کردہ کوڈ میں خامیوں کو جھنڈا لگائے بغیر گزر جائے۔ یہ ناقص نتائج کی غیر تنقیدی رپورٹنگ پر 0% اسکور کرتا ہے، جو اس نشان کو حاصل کرنے والا پہلا کلاڈ ماڈل ہے۔
انتھروپک نے ایک تشویش کو جھنڈا دیا۔ بشریات نے تشویش کے ایک علاقے کی نشاندہی کی۔ تقریباً 5% تربیتی مثالوں میں، ماڈل نے تشخیص کے معیار کے بارے میں یہ بتائے بغیر استدلال کرنا شروع کیا کہ اس کا جائزہ لیا جا رہا ہے۔
کمپنی نے کہا کہ اس سے برا مشاہدہ کرنے والا رویہ پیدا نہیں ہوا لیکن اسے "ایک ایسا رجحان جو مستقبل میں تربیت کو پیچیدہ بنا سکتا ہے" قرار دیا، فی VentureBeat۔
Mythos Preview سائبرسیکیوریٹی کے کام کے لیے پروجیکٹ Glasswing کے تحت بہت کم تنظیموں تک محدود ہے۔ اینتھروپک نے کہا کہ وہ آنے والے ہفتوں میں اپنے تمام صارفین کے لیے Mythos کلاس ماڈلز لانے کی توقع رکھتا ہے، ایک بار جب اضافی سائبر حفاظتی اقدامات کیے جائیں گے، فی Axios۔ کمپنی نے سستے ماڈلز کو بھی چھیڑا جو "Opus جیسی بہت سی صلاحیتیں فراہم کریں گے۔"
جیسا کہ کرپٹو پولیٹن نے نوٹ کیا جب نومبر میں Opus 4.5 کو دوبارہ ریلیز کیا گیا تھا، Anthropic 2026 سے تقریباً ہر دو ماہ کے ریلیز شیڈول پر ہے۔ Opus 4.8 کی آمد کے صرف 41 دن بعد Opus 4.7 نے اس شیڈول کو تیز کر دیا۔
ڈیپ سیک کا فرق اسی ہفتے وسیع ہوگیا۔
دو دن پہلے، ڈیپ سیک نے V4-Pro آؤٹ پٹ کی قیمتوں کو مستقل طور پر $0.87 فی ملین ٹوکن تک کم کیا۔ Opus 4.8 معیاری پیداوار $25 ہے۔ فاسٹ موڈ $50 ہے۔
کرپٹو ٹریڈنگ بوٹس اور ڈی فائی ایجنٹس فی سیشن لاکھوں ٹوکنز پر کارروائی کرتے ہیں۔ ان جلدوں پر، ڈیپ سیک کی $0.87 کی قیمت سمجھ میں آتی ہے۔ Opus کی فیس $25 نہیں ہے۔