Claude Opus 4.8 نے تازہ ترین AI بینچ مارک ٹیسٹوں میں GPT-5.5 کو پیچھے چھوڑ دیا

ٹیبل آف کنٹینٹ انتھروپک نے Claude Opus 4.8 متعارف کرایا ہے، جو کمپنی کے اب تک کے جدید ترین AI سسٹم کی نمائندگی کرتا ہے، جو اب عالمی سطح پر قابل رسائی ہے۔ یہ ریلیز کوڈ جنریشن، منطقی استدلال، اور سچائی میں قابل ذکر اضافہ کے ساتھ Opus 4.7 پر بنا ہے۔ Claude Opus 4.8 کا تعارف: یہ Opus 4.7 پر تیز فیصلے، اپنی ترقی کے بارے میں زیادہ ایمانداری، اور اپنے پیشرووں سے زیادہ دیر تک آزادانہ طور پر کام کرنے کی صلاحیت کے ساتھ بناتا ہے۔ آج اسی قیمت پر دستیاب ہے۔ pic.twitter.com/EufxL7T1kb — Claude (@claudeai) 28 مئی، 2026 کو اینتھروپک کے ذریعے کیے گئے بینچ مارک کے جائزے یہ ظاہر کرتے ہیں کہ Opus 4.8 OpenAI کے GPT-5.5 اور Google کے Gemini 3.1 Pro کے مقابلے میں متعدد ٹیسٹنگ زمروں میں اعلیٰ نتائج فراہم کرتا ہے۔ ماڈل خاص طور پر خود مختار کوڈنگ کے کاموں، مالیاتی ڈیٹا کے تجزیہ، اور کمپیوٹر کے تعامل کے منظرناموں میں سبقت لے جاتا ہے۔ خود مختار AI کم سے کم انسانی نگرانی کے ساتھ پیچیدہ کارروائیوں کو انجام دینے کے قابل ٹیکنالوجی کی وضاحت کرتا ہے۔ یہ صلاحیت اہمیت حاصل کر رہی ہے کیونکہ تنظیمیں AI سے چلنے والے ایجنٹوں کو اپنے ورک فلو میں ضم کرتی ہیں۔ سب سے زیادہ قابل ذکر خصوصیات میں کوشش کی ایڈجسٹمنٹ کنٹرولز کا تعارف ہے، جو اب Claude.ai اور Claude Cowork کے ذریعے دستیاب ہے۔ یہ فعالیت صارفین کو مخصوص درخواستوں کے لیے مختص کمپیوٹیشنل وسائل کو ریگولیٹ کرنے کے قابل بناتی ہے۔ سیدھے سوالات کو سنبھالتے وقت، صارف وقت اور کمپیوٹیشنل اکائیوں دونوں کو بچانے کے لیے پروسیسنگ کی شدت کو کم کر سکتے ہیں۔ اس کے برعکس، چیلنجنگ پراجیکٹس مزید مکمل تجزیہ کے لیے پروسیسنگ پاور میں اضافہ حاصل کر سکتے ہیں۔ کمپیوٹیشنل اکائیاں پیمائش کے معیاری AI خدمات کے طور پر کام کرتی ہیں جو ان پٹ اور آؤٹ پٹ کی مقدار درست کرنے کے لیے استعمال کرتی ہیں۔ AI سسٹم کے ساتھ ہر تعامل ان اکائیوں کو استعمال کرتا ہے، پیچیدگی سے قطع نظر - بنیادی سوالات سے لے کر جدید ترین پروگرامنگ کی درخواستوں تک۔ پروسیسنگ کی شدت کو کم کرنے سے یونٹ کی کھپت میں کمی واقع ہوتی ہے، جس سے زیادہ استعمال والی تنظیموں کے اخراجات میں ممکنہ طور پر کمی واقع ہوتی ہے۔ وشوسنییتا میں بہتری کے حوالے سے، Opus 4.8 Opus 4.7 کے مقابلے میں کوڈنگ کی غلطیوں کی نشاندہی کرنے میں 400% اضافہ کا مظاہرہ کرتا ہے۔ یہ لائیو پروڈکشن سسٹمز میں ماڈل کو تعینات کرنے والے سافٹ ویئر ڈویلپرز کے لیے کافی حد تک اپ گریڈ کی نمائندگی کرتا ہے۔ کمپنی بیک وقت کلاڈ کوڈ کے اندر متحرک ورک فلو کے تجرباتی ورژن کی نقاب کشائی کر رہی ہے۔ یہ صلاحیت وسیع پیمانے پر کوڈ منتقلی کے منصوبوں کو منظم کرنے کے لیے بیک وقت سینکڑوں ذیلی عملوں کے تعاون کو قابل بناتی ہے۔ زیادہ شفافیت کے لیے نظام کو بھی بہتر کیا گیا ہے۔ Anthropic کے مطابق، ماڈل اپنے تجزیے میں حدود کو تسلیم کرے گا اور غیر مصدقہ معلومات پیش کرنے سے گریز کرے گا۔ فاسٹ موڈ آپریشنز نمایاں طور پر زیادہ اقتصادی ہو گئے ہیں۔ آخری صارفین کے لیے $10 فی ملین ان پٹ ٹوکن اور $50 فی ملین آؤٹ پٹ ٹوکنز کی شائع شدہ شرح کو برقرار رکھتے ہوئے آپریٹنگ اخراجات میں 66% کی کمی واقع ہوئی ہے۔ معیاری درجے کی قیمتیں $5 فی ملین ان پٹ ٹوکنز اور $25 فی ملین آؤٹ پٹ ٹوکن پر مستقل رہتی ہیں۔ Opus 4.8 کا تعارف ان رپورٹس سے مطابقت رکھتا ہے کہ Anthropic 30 بلین ڈالر سے زیادہ کے پری IPO فنڈنگ راؤنڈ کو حتمی شکل دے رہا ہے۔ اس سرمایہ کاری سے کمپنی کی قیمت $900 بلین سے تجاوز کر سکتی ہے۔ اگرچہ اینتھروپک نے سرکاری طور پر عوامی سطح پر جانے کے منصوبوں کا اعلان نہیں کیا ہے، لیکن صنعت کے ذرائع بتاتے ہیں کہ 2026 کے اسٹاک مارکیٹ کی پہلی شروعات ہے۔ یہ ٹائم لائن OpenAI اور SpaceX پر جاری تقابلی تیاریوں کے ساتھ مطابقت رکھتی ہے، یہ دونوں عوامی پیشکشوں پر غور کر رہے ہیں۔ اوپن اے آئی ٹیم کے سابق ممبران کے ذریعہ قائم کیا گیا، اینتھروپک مصنوعی ذہانت کے شعبے میں ایک بڑے کھلاڑی کے طور پر ابھرا ہے۔ ماہرانہ تجزیہ کے ساتھ AI، Crypto اور ٹیکنالوجی میں اعلیٰ کارکردگی کا مظاہرہ کرنے والے اسٹاکس دریافت کریں۔