Cryptonews

گوگل پیرنٹ فرم نے Gemini API صارفین کے لیے قابل توسیع ادائیگی کے درجات متعارف کرائے ہیں۔

ماخذ
cryptonewstrend.com
شائع شدہ
گوگل پیرنٹ فرم نے Gemini API صارفین کے لیے قابل توسیع ادائیگی کے درجات متعارف کرائے ہیں۔

مندرجات کا جدول 2 اپریل کو، گوگل نے اپنے Gemini API کے لیے قیمتوں کا ایک جامع اپ ڈیٹ متعارف کرایا، جس میں سروس کے پانچ الگ الگ درجے متعارف کرائے گئے: سٹینڈرڈ، فلیکس، ترجیح، بیچ، اور کیشنگ۔ یہ توسیع ڈیولپرز کو لاگت کی کارکردگی، رسپانس ٹائم، اور کارکردگی کی وشوسنییتا کی بنیاد پر اپنی ایپلی کیشنز کو بہتر بنانے کے لیے زیادہ لچک فراہم کرتی ہے۔ جیمنی API میں ہمارے نئے فلیکس اور ترجیحی انفرنس ٹائرز کے ساتھ لاگت اور وشوسنییتا کو متوازن رکھیں! فلیکس: لاگت کے لحاظ سے حساس اور تاخیر سے برداشت کرنے والے کام کے بوجھ کے لیے 50% کم ادائیگی کریں ترجیح: آپ کی انتہائی اہم، متعامل ایپس کے لیے اعلیٰ ترین قابل اعتماد (پریمیم قیمتوں کے ساتھ) async کے ساتھ مل کر… pic.twitter.com/dCCTZsQydX — Google AI Developers (@ google AI Developers) (@ 26 اپریل کو متعارف کروائیں) غیر وقتی حساس پس منظر کی کارروائیوں کو نشانہ بناتا ہے جو تاخیر سے آنے والے ردعمل کو برداشت کر سکتے ہیں۔ کم استعمال شدہ کمپیوٹنگ وسائل کو آف پیک ادوار کے دوران استعمال کرتے ہوئے، یہ معیاری نرخوں کے مقابلے میں قیمت میں 50% کمی فراہم کرتا ہے۔ رسپانس میں تاخیر 1 سے 15 منٹ کے درمیان ہوتی ہے بغیر ضمانت شدہ ترسیل کے اوقات کے۔ مثالی ایپلی کیشنز میں CRM ڈیٹا سنکرونائزیشن، کمپیوٹیشنل ریسرچ ماڈل، اور خودکار ایجنٹ ورک فلوز شامل ہیں۔ جو چیز Flex کو پہلے سے موجود Batch API سے ممتاز کرتی ہے وہ اس کا ہم آہنگ اختتامی نقطہ فن تعمیر ہے۔ ڈویلپرز فائل پر مبنی ان پٹس/آؤٹ پٹس کو منظم کرنے یا کام کی تکمیل کی صورتحال کی نگرانی کرنے کی پیچیدگی سے بچتے ہیں۔ یہ ہموار طریقہ عمل کو آسان بناتے ہوئے لاگت کے یکساں فوائد کو برقرار رکھتا ہے۔ Alphabet Inc., GOOGL اس کے برعکس، ترجیحی درجے میں اعلی درجے کی، وقت کی اہم ایپلی کیشنز کا پتہ چلتا ہے۔ معیاری نرخوں سے 75% سے 100% تک قیمتوں کے تعین کے ساتھ، یہ ملی سیکنڈ سے سیکنڈز میں ماپنے والے تیز رفتار ردعمل کے اوقات کی ضمانت دیتا ہے۔ گوگل لائیو کسٹمر سروس چیٹ بوٹس، ریئل ٹائم فراڈ سے بچاؤ کے نظام، اور خودکار مواد کی فلٹرنگ جیسے استعمال کے معاملات کو ترجیح دیتا ہے۔ جب ترجیحی درجے کا استعمال مختص کردہ کوٹے سے زیادہ ہو جاتا ہے، تو اضافی درخواستیں غلطیوں کو پیدا کرنے کے بجائے معیاری درجے کی پروسیسنگ میں شفٹ ہو جاتی ہیں۔ اصل بیچ API 50% لاگت کی بچت کے ساتھ کام جاری رکھے ہوئے ہے اور 24 گھنٹے تک کی لیٹنسی ونڈوز کو قبول کرتا ہے۔ یہ اختیار انتہائی آف لائن کمپیوٹیشن کے مطابق ہے جہاں فوری نتائج ضروری نہیں ہیں۔ کیچنگ ٹائر ٹوکن کی مقدار اور مواد کے ذخیرہ کی مدت کی بنیاد پر قیمتوں کے تعین کے ماڈلز کا استعمال کرتا ہے۔ Google اس درجے کی تجویز کرتا ہے کہ وسیع پیمانے پر سسٹم پرامپٹس کے ساتھ بات چیت کے AI کے لیے، بڑے ویڈیو ڈیٹا سیٹس کے بار بار ہونے والے تجزیے، یا خاطر خواہ دستاویزات کے مجموعوں میں تلاش کریں۔ Flex اور Priority Tiers دونوں API کالز کے اندر ایک جیسے service_tier پیرامیٹرز کا استعمال کرتے ہیں۔ ڈویلپرز آسان کنفیگریشن ایڈجسٹمنٹ کے ذریعے ٹائرز کے درمیان سوئچ کر سکتے ہیں، API کے جوابات سے ہر درخواست پر کارروائی کرنے والے درجے کی تصدیق ہوتی ہے۔ جنریٹ کونٹنٹ اور انٹرایکشن API اینڈ پوائنٹس کا استعمال کرتے ہوئے تمام بامعاوضہ درجے کے سبسکرائبرز تک فلیکس رسائی کا دائرہ وسیع ہے۔ ترجیح ٹائر 2 اور ٹائر 3 ادا شدہ اکاؤنٹس تک محدود ہے جو ایک جیسے اختتامی پوائنٹس تک رسائی حاصل کرتے ہیں۔ معیاری انٹرفیس سب سے اہم پیشرفت کی نمائندگی کرتا ہے۔ اس سے پہلے، بیک گراؤنڈ آپریشنز اور انٹرایکٹو ورک بوجھ دونوں کو منظم کرنے کے لیے ہم وقت ساز اور غیر مطابقت پذیر پروسیسنگ کے لیے الگ آرکیٹیکچرل فریم ورک کی ضرورت تھی۔ موجودہ اپ ڈیٹ متحد ہم آہنگی کے اختتامی نقطوں کے ذریعے دونوں کو یکجا کرتا ہے۔ گوگل نے اس اضافہ کو AI ایجنٹ کی ترقی میں معاونت کے لیے لازمی قرار دیا، جس کے لیے اکثر کم ترجیحی پس منظر کے کاموں اور وقت کے لحاظ سے حساس انٹرایکٹو فنکشنز کو بیک وقت سنبھالنے کی ضرورت ہوتی ہے۔ جیمنی API پروڈکٹ مینیجر لوسیا لوہر اور انجینئرنگ لیڈ حسین حسن ہیریرو نے 2 اپریل 2026 کو اپ ڈیٹ کا اعلان کیا۔