تقدم الشركة الأم لشركة Google مستويات دفع قابلة للتطوير لمستخدمي Gemini API

جدول المحتويات في 2 أبريل، طرحت Google تحديثًا شاملاً للتسعير لواجهة برمجة تطبيقات Gemini الخاصة بها، حيث قدمت خمسة مستويات خدمة منفصلة: Standard، وFlex، وPriority، وBatch، وCaching. يوفر هذا التوسع للمطورين مرونة أكبر لتحسين تطبيقاتهم بناءً على كفاءة التكلفة ووقت الاستجابة وموثوقية الأداء. يمكنك تحقيق التوازن بين التكلفة والموثوقية من خلال مستويات الاستدلال المرنة والأولوية الجديدة في Gemini API! المرونة: ادفع أقل بنسبة 50% مقابل أعباء العمل الحساسة من حيث التكلفة والمتسامحة مع زمن الاستجابة. الأولوية: أعلى موثوقية لتطبيقاتك التفاعلية الأكثر أهمية (مع التسعير المتميز) جنبًا إلى جنب مع غير المتزامن... pic.twitter.com/dCCTZsQydX - Google AI Developers (@googleaidevs) 2 أبريل 2026 يستهدف المستوى المرن الذي تم تقديمه حديثًا عمليات الخلفية غير الحساسة للوقت والتي يمكنها تحمل الاستجابات المتأخرة. ومن خلال الاستفادة من موارد الحوسبة غير المستغلة بشكل كافٍ خلال فترات خارج أوقات الذروة، فإنها توفر تخفيضًا في السعر بنسبة 50% مقارنة بالمعدلات القياسية. يتراوح زمن الاستجابة بين 1 و15 دقيقة بدون أوقات تسليم مضمونة. تشمل التطبيقات المثالية مزامنة بيانات CRM، ونماذج البحث الحسابية، وسير عمل الوكيل الآلي. ما يميز Flex عن Batch API الموجود مسبقًا هو بنية نقطة النهاية المتزامنة. يتجنب المطورون تعقيد إدارة المدخلات/المخرجات القائمة على الملفات أو مراقبة حالة إكمال المهمة. يحافظ هذا النهج المبسط على فوائد تكلفة متطابقة مع تبسيط التنفيذ. Alphabet Inc.، GOOGL وعلى العكس من ذلك، فإن طبقة الأولوية تتناول التطبيقات عالية المخاطر والتي تتطلب وقتًا حرجًا. مع أسعار أعلى بنسبة 75% إلى 100% من الأسعار القياسية، فإنها تضمن أوقات استجابة سريعة تقاس بالمللي ثانية إلى الثواني. تضع Google الأولوية لحالات الاستخدام مثل برامج الدردشة المباشرة لخدمة العملاء، وأنظمة منع الاحتيال في الوقت الفعلي، والتصفية التلقائية للمحتوى. عندما يتجاوز استخدام طبقة الأولوية الحصص المخصصة، تتحول الطلبات الفائضة بأمان إلى معالجة الطبقة القياسية بدلاً من إنشاء أخطاء. تستمر واجهة Batch API الأصلية في العمل مع توفير التكاليف بنسبة 50% وتقبل فترات زمن الوصول الممتدة إلى 24 ساعة. يناسب هذا الخيار العمليات الحسابية المكثفة دون الاتصال بالإنترنت حيث لا تكون النتائج الفورية ضرورية. تستخدم طبقة التخزين المؤقت نماذج تسعير تعتمد على كميات الرمز المميز ومدة تخزين المحتوى. توصي Google بهذا المستوى للذكاء الاصطناعي للمحادثة مع مطالبات النظام الشاملة، أو التحليل المتكرر لمجموعات بيانات الفيديو الكبيرة، أو عمليات البحث عبر مجموعات كبيرة من المستندات. تستخدم كل من الطبقة المرنة والأولوية معلمات مستوى خدمة متطابقة ضمن استدعاءات واجهة برمجة التطبيقات. يمكن للمطورين التبديل بين الطبقات من خلال تعديلات التكوين البسيطة، مع استجابات واجهة برمجة التطبيقات (API) التي تؤكد الطبقة التي عالجت كل طلب. تمتد إمكانية الوصول المرنة إلى جميع المشتركين في الطبقة المدفوعة باستخدام نقاط نهاية GenerateContent وInteractions API. تظل الأولوية مقتصرة على الحسابات المدفوعة من المستوى 2 والمستوى 3 والتي تصل إلى نقاط نهاية متطابقة. تمثل الواجهة الموحدة التقدم الأكثر أهمية. في السابق، كانت إدارة كل من العمليات الخلفية وأحمال العمل التفاعلية تتطلب أطرًا معمارية منفصلة للمعالجة المتزامنة وغير المتزامنة. يقوم التحديث الحالي بدمج كليهما من خلال نقاط النهاية المتزامنة الموحدة. وضعت Google هذا التحسين كجزء لا يتجزأ من دعم تطوير وكيل الذكاء الاصطناعي، والذي يتطلب في كثير من الأحيان معالجة متزامنة لمهام الخلفية ذات الأولوية المنخفضة والوظائف التفاعلية الحساسة للوقت. أعلنت مديرة منتج Gemini API لوسيا لوهر ورئيس الهندسة حسين حسن هاريرو عن التحديث في 2 أبريل 2026.