OpenAI کی طرف سے تازہ ترین AI بریک تھرو بہتر صلاحیتوں اور بھاری قیمت کے ٹیگ کے ساتھ پہنچا

مختصراً

GPT-5.5 آج پلس، پرو، بزنس، اور انٹرپرائز صارفین کے لیے ChatGPT اور Codex میں لانچ ہو رہا ہے، API رسائی کے ساتھ جلد ہی $5/M ان پٹ ٹوکنز اور $30/M آؤٹ پٹ ٹوکنز پر آ رہا ہے۔

ماڈل نے Terminal-Bench 2.0 پر 82.7% حاصل کیا—ایک بینچ مارک ٹیسٹنگ کمپلیکس کمانڈ لائن ورک فلوز—Claude Opus 4.7 کو 69.4% اور Gemini 3.1 Pro کو 68.5% پر شکست دے کر۔

GPT-5.5 GPT-5.4 جیسے کوڈیکس کاموں کو مکمل کرنے کے لیے نمایاں طور پر کم ٹوکن استعمال کرتا ہے، جس کی قیمت زیادہ ہونے کے باوجود اسے زیادہ موثر بناتی ہے۔

OpenAI نے جمعرات کو GPT-5.5 کا آغاز کیا، جس نے اسے بنیادی طور پر ایجنٹی کمپیوٹر کے استعمال پر ہدف بنایا ہوا ماڈل بنایا۔ یہ کوڈ لکھتا اور ڈیبگ کرتا ہے، ویب براؤز کرتا ہے، اسپریڈ شیٹس کو پُر کرتا ہے، اور ہر اقدام کو بیبیسیٹ کرنے کے لیے انسان کی ضرورت کے بغیر ملٹی سٹیپ ٹاسک کے ذریعے کام کرتا رہتا ہے۔

اوپن اے آئی نے کہا کہ یہ ریلیز آج پہلے ہی پلس، پرو، بزنس، اور انٹرپرائز سبسکرائبرز کے لیے چیٹ جی پی ٹی اور کوڈیکس میں شروع ہو رہی ہے۔

OpenAI نے ایک اعلان میں کہا، "ہم GPT-5.5 کو جاری کر رہے ہیں، جو ابھی تک اپنا سب سے ہوشیار اور استعمال میں سب سے زیادہ بدیہی ماڈل ہے، اور کمپیوٹر پر کام کرنے کے نئے طریقے کی طرف اگلا قدم ہے۔" "فائدہ خاص طور پر ایجنٹی کوڈنگ، کمپیوٹر کے استعمال، علمی کام، اور ابتدائی سائنسی تحقیق میں مضبوط ہوتے ہیں — وہ علاقے جہاں پیش رفت کا انحصار سیاق و سباق میں استدلال اور وقت کے ساتھ ساتھ کارروائی کرنے پر ہوتا ہے۔

GPT-5.5 کا تعارف

حقیقی کام اور طاقت دینے والے ایجنٹوں کے لیے ذہانت کا ایک نیا طبقہ، پیچیدہ اہداف کو سمجھنے، ٹولز استعمال کرنے، اس کے کام کی جانچ کرنے، اور مزید کاموں کو تکمیل تک لے جانے کے لیے بنایا گیا ہے۔ یہ کمپیوٹر پر کام کرنے کے ایک نئے طریقے کی نشاندہی کرتا ہے۔

اب ChatGPT اور Codex میں دستیاب ہے۔ pic.twitter.com/rPLTk99ZH5

— OpenAI (@OpenAI) 23 اپریل 2026

OpenAI کی بڑی سرخی: GPT-5.5 اپنے پیشرو، GPT-5.4 — کے مقابلے میں پیمائش سے زیادہ ہوشیار ہے اور یہ سست نہیں ہے۔ حقیقی دنیا کی خدمت میں GPT-5.4 کی فی ٹوکن لیٹنسی سے مماثل بینچ مارکس میں اعلی اسکور حاصل کرتے ہوئے کارکردگی میں بہتری کی وہ قسم ہے جو عام طور پر نہیں ہوتی ہے۔ ایک ہی ہارڈ ویئر کے تحت چلنے پر بڑے ماڈلز سست ہوتے ہیں۔

ٹرمینل بنچ 2.0 پر، جو جانچتا ہے کہ ایک ماڈل کس حد تک پیچیدہ کمانڈ لائن ورک فلو کو ہینڈل کرتا ہے جس کے لیے منصوبہ بندی اور تکراری ٹول کے استعمال کی ضرورت ہوتی ہے، GPT-5.5 کا اسکور 82.7% ہے۔ Claude Opus 4.7 69.4% پر اترتا ہے، جبکہ Gemini 3.1 Pro 68.5% پر بیٹھتا ہے۔ یہ کوئی معمولی برتری نہیں ہے۔

GDPval پر، 44 حقیقی پیشوں پر ایک بینچ مارک ٹیسٹنگ نالج کام کرتا ہے—فنانس سے لے کر قانونی تحقیق تک پروڈکٹ مینجمنٹ تک—GPT-5.5 84.9% موازنوں میں صنعت کے پیشہ ور افراد سے مماثلت رکھتا ہے۔

تصویر: اوپن اے آئی

یہ ایک بہت اچھا کوڈر بھی ہے، جیسا کہ توقع ہے۔ Expert-SWE پر، 20 گھنٹے کے درمیانی اندازے کے مطابق انسانی تکمیل کے وقت کے ساتھ طویل افق کوڈنگ کے کاموں کے لیے ایک داخلی معیار، GPT-5.5 GPT-5.4 کو پیچھے چھوڑ دیتا ہے۔ SWE-Bench Pro پر، جو حقیقی دنیا کے GitHub کے مسئلے کے حل کو درجہ دیتا ہے، یہ 58.6% تک پہنچ جاتا ہے۔ Claude Opus 4.7 کا اسکور 64.3% زیادہ ہے، لیکن OpenAI کا دعویٰ ہے کہ یہ اس لیے ہو سکتا ہے کہ "انتھروپک نے مسائل کے ذیلی سیٹ پر یادداشت کی علامات کی اطلاع دی"

یہ لانچ ایک ایسی مارکیٹ میں اترتا ہے جو ایجنٹ AI کے عروج کے بعد سے تیزی سے آگے بڑھ رہا ہے۔ GPT-5.4 GPT-5.3 کے صرف دو دن بعد پہنچا، جب کہ Xiaomi MiMo-V2-Pro سے MiMo 2.5 Pro تک گیا—مکمل ملٹی موڈل صلاحیتوں کے ساتھ — تقریباً پانچ ہفتوں میں۔ GPT-5.4 اور GPT-5.5 کے درمیان وقفہ تقریباً سات ہفتوں کا تھا۔ اب یہی رفتار ہے۔

لیکن کیا یہ ماڈل روزمرہ کے صارفین کے لیے فرق کرے گا جو ہمیشہ اگلی بڑی چیز کو کوڈ نہیں کرتے ہیں؟ اگر آپ مفت درجے پر ہیں، نہیں: GPT-5.5 مفت صارفین کے لیے نہیں آ رہا ہے۔ اگر آپ پلس کے لیے $20/ماہ پر ادائیگی کر رہے ہیں، تو یہ آج ہی شروع ہو جائے گا۔ ہم نے اسے اپنے پرو اکاؤنٹ کے تحت آزمانے کی کوشش کی، لیکن ماڈل فوری طور پر دستیاب نہیں تھا۔

سب سے بڑی بات شاید وہ ہے جو GPT-5.5 Codex کے اندر کرتا ہے — OpenAI کے ایجنٹ کوڈنگ ماحول — جہاں یہ زیادہ طاقتور ثابت ہوتا ہے۔ "یہ حقیقی طور پر محسوس ہوتا ہے کہ میں ایک اعلی ذہانت کے ساتھ کام کر رہا ہوں، اور تقریباً احترام کا احساس ہے،" Pietro Schirano، MagicPath کے سی ای او نے OpenAI کے اشتراک کردہ ایک اقتباس میں کہا۔

GPT-5.5 پرو، سخت، اعلیٰ درستگی کے کام کے لیے ڈیزائن کیا گیا ہے، ChatGPT میں پرو، بزنس، اور انٹرپرائز صارفین کے لیے الگ سے رول آؤٹ کر رہا ہے۔ BrowseComp پر، جو پورے ویب پر مشکل سے تلاش کرنے والی معلومات کو ٹریک کرنے کے لیے ماڈل کی صلاحیت کی جانچ کرتا ہے، GPT-5.5 Pro کا اسکور 90.1% ہے، جو Gemini 3.1 Pro سے 85.9% پر آگے ہے۔

مصنوعی تجزیہ انڈیکس کی بنیاد پر ماڈل اوسطاً سب سے زیادہ ذہین بھی ہے۔ GPT 5.5 ٹوکنز کے زیادہ موثر اور مفید استعمال کی اطلاع دیتا ہے، جو عام طور پر بہتر نتائج پیدا کرتا ہے۔

تصویر: اوپن اے آئی

تاہم، قیمتوں کا تعین کچھ صارفین کو چونکا سکتا ہے۔ API شروع ہونے پر $5 فی ملین ان پٹ ٹوکن اور $30 فی ملین آؤٹ پٹ ٹوکن چارج کرے گا، جو OpenAI کا کہنا ہے کہ "بہت جلد" آرہا ہے۔ API میں GPT-5.5 پرو کی لاگت $30 فی ملین ان پٹ ٹوکن اور $180 فی ملین آؤٹ پٹ ٹوکنز ہوگی۔

یہ اعداد و شمار GPT-5.4—$2.50 فی ملین ٹوکن ان پٹ اور $15.00 فی ملین ٹوکن آؤٹ پٹ سے زیادہ ہیں—جبکہ GPT-5.5 Pro کی قیمتیں GPT-5.4 پرو جیسی ہی رہتی ہیں۔

کے

اس نے کہا، اوپن اے آئی کے سی ای او سیم آلٹ مین نے X پر دلیل دی کہ ٹوکن کی کارکردگی کا فائدہ لاگت کو پورا کرتا ہے—GPT-5.5 وہی کوڈیکس کاموں کو کم ٹوکن کے ساتھ مکمل کرتا ہے، جس کا مطلب ہے کہ زیادہ فی ٹوکن ریٹ پر بھی سستی دوڑیں۔

صرف موازنہ کے لیے، Xiaomi MiMo v2.5 Pro