Прорыв в интеграции: Tether активирует мощную технологию искусственного интеллекта от Google на стандартных потребительских устройствах

Группа исследований искусственного интеллекта Tether выпустила производственную версию TurboQuant с открытым исходным кодом, алгоритма сжатия памяти, первоначально разработанного Google Research. Этот выпуск является частью QVAC SDK 0.12.0 и предназначен для ноутбуков, телефонов, периферийных устройств и децентрализованных сетей. Это позволяет локальным моделям искусственного интеллекта обрабатывать более длительные сеансы, не полагаясь на облачную инфраструктуру. Это знаменует собой практический сдвиг в том, как ИИ на устройстве управляет задачами, интенсивно использующими память. Память уже давно является препятствием для запуска эффективных моделей искусственного интеллекта на потребительском оборудовании. Когда ИИ-помощник обрабатывает длинный документ или разговор, он сохраняет этот контекст в так называемом KV-кеше. При примерно 262 000 токенах кэш KV для модели 4B может потреблять только около 8 ГБ памяти. Четыре одновременных сеанса могут увеличить эту цифру до 32 ГБ без учета самой модели. TurboQuant решает эту проблему, сжимая кэш KV до пяти раз, сохраняя при этом качество вывода, близкое к несжатой модели. Теперь пользователь может попросить помощника на ноутбуке проанализировать стостраничный юридический документ, не загружая его на удаленный сервер. Tether AI обновляет QVAC SDK, внедряя TurboQuant в повседневные устройства и предоставляя память размером с локальный центр обработки данных AI.Подробнее: https://t.co/mF2uwDB8rv — Tether (@tether) 1 июня 2026 г. Студенты, разработчики, журналисты и исследователи могут извлечь выгоду из более длительных и контекстно-зависимых сеансов искусственного интеллекта на устройствах, которыми они уже владеют. Говоря о более широких причинах выпуска, генеральный директор Tether Паоло Ардоино указал на разрыв между исследованиями и практическим программным обеспечением. «Исследование Google показало, что память ИИ можно сжимать гораздо эффективнее, чем предполагало большинство людей», — сказал он. «Наша работа приносит тот прорыв в производстве программного обеспечения, с помощью которого разработчики, стартапы и пользователи действительно могут создавать». Производственная версия включает в себя полный конвейер квантования, адаптеры платформы, документацию для разработчиков и профили, настроенные под рабочую нагрузку. Эти компоненты предназначены для реальных сред за пределами гипермасштабируемых центров обработки данных, охватывая ограниченную память, смешанное оборудование и развертывания, чувствительные к задержкам. TurboQuant поставляется как часть QVAC SDK 0.12.0, интегрированная непосредственно в Fabric, основной компонент стека QVAC. Fabric начинался как форк llama.cpp и с тех пор разросся, включив в себя множество исследовательских достижений. SDK предоставляет разработчикам унифицированный набор инструментов, библиотек и компонентов среды выполнения для создания локальных приложений ИИ. Для стартапов и независимых разработчиков это избавляет от предположения, что для крупных продуктов искусственного интеллекта требуются дорогие кластеры графических процессоров. Теперь команды могут проектировать более длинные контекстные окна, большие файловые рабочие нагрузки и гибкое развертывание на потребительском и периферийном оборудовании. Это открывает практические пути для создания продуктов искусственного интеллекта без облачной архитектуры. Решая проблемы, связанные с конфиденциальностью данных и зависимостью от облака, Ардоино выступил за сохранение задач ИИ на локальных устройствах. «Люди должны иметь возможность попросить ИИ-помощника прочитать длинный документ или обработать личную информацию, при этом каждая задача не будет выполняться через удаленный центр обработки данных», — сказал он. В этом смысле TurboQuant дает местному ИИ больше возможностей для работы. Стратегия Tether сосредоточена на искусственном интеллекте, который работает ближе к пользователям, через персональные устройства и децентрализованные сети. Компания рассматривает эффективность и портативность программного обеспечения как определяющие факторы на следующем этапе развития ИИ, наряду с крупномасштабной вычислительной инфраструктурой.