Cryptonews

Материнская фирма Google представляет масштабируемые уровни оплаты для пользователей Gemini API

Источник
cryptonewstrend.com
Опубликовано
Материнская фирма Google представляет масштабируемые уровни оплаты для пользователей Gemini API

Оглавление 2 апреля Google выпустил комплексное обновление цен на свой Gemini API, введя пять отдельных уровней обслуживания: «Стандартный», «Гибкий», «Приоритет», «Пакетный» и «Кэширование». Это расширение предоставляет разработчикам большую гибкость для оптимизации своих приложений с учетом экономической эффективности, времени отклика и надежности работы. Сбалансируйте стоимость и надежность с помощью наших новых уровней вывода Flex и Priority в Gemini API! Flex: платите на 50 % меньше за экономичные и устойчивые к задержкам рабочие нагрузки. Приоритет: высочайшая надежность для ваших наиболее важных интерактивных приложений (с премиальной ценой). Вместе с асинхронным… pic.twitter.com/dCCTZsQydX — Разработчики Google AI (@googleaidevs) 2 апреля 2026 г. Недавно представленный уровень Flex нацелен на независящие от времени фоновые операции, которые могут допускать задержки ответов. За счет использования недостаточно используемых вычислительных ресурсов в периоды низкой нагрузки это обеспечивает снижение цен на 50 % по сравнению со стандартными тарифами. Задержка ответа варьируется от 1 до 15 минут без гарантированного времени доставки. Идеальные приложения включают синхронизацию данных CRM, модели вычислительных исследований и автоматизированные рабочие процессы агентов. Что отличает Flex от ранее существовавшего Batch API, так это его синхронная архитектура конечных точек. Разработчики избегают сложностей с управлением входными/выходными файлами или отслеживанием статуса выполнения заданий. Этот оптимизированный подход обеспечивает идентичную экономическую выгоду, одновременно упрощая внедрение. Alphabet Inc., GOOGL И наоборот, уровень Priority предназначен для приложений с высокими требованиями и критичным временем. Цены на 75–100 % выше стандартных, что гарантирует быстрое время отклика, измеряемое от миллисекунд до секунд. Google занимает приоритетное место для таких вариантов использования, как живые чат-боты для обслуживания клиентов, системы предотвращения мошенничества в реальном времени и автоматическая фильтрация контента. Когда использование уровня «Приоритет» превышает выделенные квоты, избыточные запросы плавно переходят на обработку уровня «Стандарт» вместо генерации ошибок. Исходный пакетный API продолжает работать с 50-процентной экономией средств и допускает окна задержки, увеличивающиеся до 24 часов. Этот вариант подходит для интенсивных автономных вычислений, когда немедленные результаты не нужны. На уровне кэширования используются модели ценообразования, основанные на количестве токенов и продолжительности хранения контента. Google рекомендует этот уровень для диалогового ИИ с обширными системными подсказками, повторяющимся анализом больших наборов видеоданных или поиском в значительных коллекциях документов. Уровни Flex и Priority используют одинаковые параметры service_tier в вызовах API. Разработчики могут переключаться между уровнями посредством простой настройки конфигурации, при этом ответы API подтверждают уровень, обрабатывающий каждый запрос. Доступность Flex распространяется на всех подписчиков платного уровня, использующих конечные точки API GenerateContent и Interactions. Приоритет по-прежнему ограничен платными учетными записями уровней 2 и 3, имеющими доступ к идентичным конечным точкам. Стандартизированный интерфейс представляет собой наиболее значительное достижение. Раньше для управления как фоновыми операциями, так и интерактивными рабочими нагрузками требовались отдельные архитектурные платформы для синхронной и асинхронной обработки. Текущее обновление объединяет оба подхода посредством унифицированных синхронных конечных точек. Google позиционирует это улучшение как неотъемлемую часть поддержки разработки агентов искусственного интеллекта, которая часто требует одновременной обработки низкоприоритетных фоновых задач и интерактивных функций, чувствительных ко времени. Менеджер по продукту Gemini API Люсия Лоэр и руководитель разработки Хусейн Хасан Харриру объявили об обновлении 2 апреля 2026 года.