Cryptonews

Integración innovadora: Tether activa la potente tecnología de inteligencia artificial de Google en dispositivos de consumo estándar

Source
CryptoNewsTrend
Published
Integración innovadora: Tether activa la potente tecnología de inteligencia artificial de Google en dispositivos de consumo estándar

El grupo de investigación de IA de Tether ha lanzado una versión de producción de código abierto de TurboQuant, un algoritmo de compresión de memoria desarrollado originalmente por Google Research. El lanzamiento es parte de QVAC SDK 0.12.0 y está dirigido a computadoras portátiles, teléfonos, dispositivos periféricos y redes descentralizadas. Permite que los modelos de IA locales manejen sesiones más largas sin depender de la infraestructura de la nube. Esto marca un cambio práctico en la forma en que la IA en el dispositivo gestiona tareas que requieren mucha memoria. La memoria ha sido durante mucho tiempo una barrera para ejecutar modelos de IA capaces en hardware de consumo. Cuando un asistente de IA procesa un documento o una conversación larga, almacena ese contexto en lo que se llama caché KV. Con aproximadamente 262.000 tokens, la caché KV para un modelo 4B puede consumir alrededor de 8 GB de memoria solamente. Cuatro sesiones simultáneas pueden llevar esa cifra a 32 GB antes de tener en cuenta el modelo en sí. TurboQuant soluciona esto comprimiendo la caché KV hasta cinco veces mientras mantiene la calidad de salida cercana a la de un modelo sin comprimir. Un usuario ahora puede pedirle a un asistente basado en una computadora portátil que analice un documento legal de cien páginas sin cargarlo en un servidor remoto. Tether AI actualiza el SDK de QVAC, lleva TurboQuant a los dispositivos cotidianos y brinda memoria local del tamaño de un centro de datos de AI Obtenga más información: https://t.co/mF2uwDB8rv — Tether (@tether) 1 de junio de 2026 Los estudiantes, desarrolladores, periodistas e investigadores pueden beneficiarse de sesiones de AI más largas y con mayor contexto en los dispositivos que ya poseen. Hablando sobre el razonamiento más amplio detrás del lanzamiento, el CEO de Tether, Paolo Ardoino, señaló la brecha entre la investigación y el software práctico. "La investigación de Google demostró que la memoria de la IA se puede comprimir de manera mucho más eficiente de lo que la mayoría de la gente suponía", dijo. "Nuestro trabajo aporta ese avance al software de producción con el que los desarrolladores, las empresas emergentes y los usuarios realmente pueden crear". La versión de producción incluye un proceso de cuantificación completo, adaptadores de marco, documentación para desarrolladores y perfiles ajustados a la carga de trabajo. Estos componentes están diseñados para entornos reales fuera de los centros de datos de hiperescala y cubren memoria limitada, hardware mixto e implementaciones sensibles a la latencia. TurboQuant se envía como parte de QVAC SDK 0.12.0, integrado directamente en Fabric, un componente central de la pila QVAC. Fabric comenzó como una bifurcación de llama.cpp y desde entonces ha crecido hasta incorporar múltiples avances de investigación. El SDK ofrece a los desarrolladores un conjunto unificado de herramientas, bibliotecas y componentes de tiempo de ejecución para crear aplicaciones de IA locales. Para las empresas emergentes y los desarrolladores independientes, esto elimina la suposición de que los grandes productos de IA requieren costosos clústeres de GPU. Los equipos ahora pueden diseñar para ventanas de contexto más largas, cargas de trabajo de archivos más grandes e implementación flexible en hardware de consumo y de borde. Esto abre caminos prácticos para crear productos de IA sin una arquitectura basada únicamente en la nube. Al abordar las preocupaciones sobre la privacidad de los datos y la dependencia de la nube, Ardoino defendió la necesidad de mantener las tareas de IA en los dispositivos locales. "La gente debería poder pedirle a un asistente de inteligencia artificial que lea un documento extenso o trabaje con información privada sin que cada tarea sea forzada a pasar por un centro de datos remoto", dijo. TurboQuant, en ese sentido, le da a la IA local más espacio operativo. La estrategia de Tether se centra en una IA que se acerca más a los usuarios, a través de dispositivos personales y redes descentralizadas. La empresa considera que la eficiencia y la portabilidad del software son factores determinantes en la siguiente fase del desarrollo de la IA, junto con la infraestructura informática a gran escala.

Integración innovadora: Tether activa la potente tecnología de inteligencia artificial de Google en dispositivos de consumo estándar