Cryptonews

Tether presenta IA médica que se ejecuta en teléfonos, supera a los modelos SoTA mucho más grandes y puede eliminar la nube por completo

Source
CryptoNewsTrend
Published
Tether presenta IA médica que se ejecuta en teléfonos, supera a los modelos SoTA mucho más grandes y puede eliminar la nube por completo

7 de mayo de 2026 – El Grupo de Investigación de IA de Tether lanzó hoy QVAC MedPsy, una nueva clase de modelos de lenguaje médico diseñados para ejecutarse directamente en teléfonos inteligentes, dispositivos portátiles y otros dispositivos con potencia de procesamiento limitada, que ofrece un rendimiento que rivaliza y, en algunos casos, supera a modelos significativamente más grandes sin dejar de ser local y privado. En lugar de escalar el rendimiento a través del tamaño del modelo, el sistema se centra en la eficiencia, reduciendo los requisitos informáticos y, como resultado, eliminando la dependencia de la infraestructura de nube remota.

La mayoría de los sistemas actuales todavía dependen de modelos grandes que se ejecutan en servidores remotos, lo que requiere que los datos confidenciales se muevan a través de un servidor en la nube. En el sector sanitario, eso incluye registros de pacientes, consultas de diagnóstico y notas clínicas, todo ello sujeto a estrictas restricciones de privacidad y cumplimiento. A medida que el mercado pasa de aproximadamente 36 mil millones de dólares actuales a proyecciones que superarán los 500 mil millones de dólares para 2033, esa arquitectura se vuelve cada vez más difícil de justificar.

Esta versión desafía una de las suposiciones más arraigadas en la IA: que un mejor rendimiento requiere modelos más grandes y más computación. En cambio, QVAC MedPsy invierte ese modelo. Un modelo de 1.700 millones de parámetros logró una puntuación promedio de 62,62 en siete puntos de referencia médicos cerrados, superando al MedGemma-1.5-4B-it de Google en 11,42 puntos a pesar de tener menos de la mitad del tamaño. En escenarios clínicos del mundo real como HealthBench Hard, el modelo de 1.700 millones incluso supera al MedGemma 27B, un modelo casi dieciséis veces más grande. Nuestra versión QVAC MedPsy de 4 mil millones de parámetros obtuvo una puntuación de 70,54 en los mismos siete puntos de referencia cerrados, superando a los modelos casi siete veces más grandes, incluido MedGemma-27B-text, y brindó un mayor rendimiento en evaluaciones de estilo clínico como HealthBench Hard, HealthBench y MedXpertQA. En general, la evaluación abarcó ocho conjuntos de puntos de referencia diversos: MedQA-USMLE y MedMCQA para conocimientos clínicos y exámenes médicos; MMLU Health y MMLU-Pro Health para la alfabetización sanitaria; MedXpertQA para razonamiento clínico experto; PubMedQA para la comprensión de la investigación biomédica; AfriMedQA para contextos de atención sanitaria global desatendidos; y HealthBench, incluido HealthBench Hard, para escenarios clínicos del mundo real. Las mejoras en el rendimiento provienen de un proceso médico posterior al entrenamiento por etapas que combina una amplia supervisión médica, datos de razonamiento clínico de mayor valor y aprendizaje reforzado centrado en casos de razonamiento médico más difíciles.

Los modelos también reducen significativamente el costo de la inferencia. Nuestro modelo QVAC MedPsy 4B genera respuestas en aproximadamente 909 tokens en comparación con 2953 tokens para sistemas comparables, una reducción de 3,2 veces, mientras que el modelo 1,700 millones promedia alrededor de 1110 tokens frente a 1901 tokens, una reducción de 1,7 veces. Eso se traduce en tiempos de respuesta más rápidos y la capacidad de ejecutarse localmente sin depender de la infraestructura de la nube. Los modelos también se lanzan en formatos GGUF cuantificados para implementación local, con versiones Q4_K_M recomendadas con un tamaño de aproximadamente 1,2 GB para QVAC MedPsy-1.7B y 2,6 GB para QVAC MedPsy-4B. En las pruebas, esas versiones comprimidas conservaron la mayor parte del rendimiento de referencia y al mismo tiempo hicieron que los modelos fueran prácticos para entornos móviles y de vanguardia.

Esto cambia el ámbito en el que realmente se puede utilizar la IA médica. Los sistemas que anteriormente requerían procesamiento externo se pueden implementar para ayudar a los médicos dentro de sistemas in situ para el procesamiento y análisis de datos locales y seguros, en dispositivos móviles o en entornos donde las limitaciones de conectividad, latencia o privacidad hacen que los modelos basados ​​en la nube no sean prácticos. También reduce una de las principales barreras para la adopción en el sector sanitario: la necesidad de mover datos confidenciales fuera de entornos controlados.

"Con QVAC MedPsy, nuestro objetivo era mejorar la eficiencia a nivel de modelo, en lugar de aumentar el tamaño", dijo Paolo Ardoino, director ejecutivo de Tether. "En nuestras pruebas, el modelo QVAC MedPsy de 1.700 millones de parámetros superó a sistemas más grandes como MedGemma-4B, y nuestro modelo de 4.000 millones superó los resultados de modelos casi siete veces su tamaño, mientras utiliza hasta tres veces menos tokens por respuesta. Esa combinación es importante porque reduce directamente los requisitos de computación, la latencia y el costo. Permite que el modelo se ejecute localmente en hardware estándar en lugar de depender de una infraestructura remota. En la atención médica, eso cambia las limitaciones por completo; se puede ejecutar el razonamiento médico donde el Los datos ya existen, dentro de un sistema hospitalario o en un dispositivo, sin mover información confidencial a través de la nube ni esperar un procesamiento externo”.

Durante la última década, el progreso en IA ha estado vinculado al acceso a la computación basada en la nube. QVAC MedPsy apunta en una dirección diferente, donde la eficiencia, la localidad y la privacidad definen el rendimiento. Si esos avances se mantienen en implementaciones en el mundo real, podrían remodelar la economía de la infraestructura de IA médica, cambiando la ventaja hacia sistemas que operan localmente con menor costo, menor latencia y mayor control sobre los datos confidenciales.

Lea más en https://qvac.tether.io/models/

Acerca de los datos de Tether

Tether Data, S.A. d

Tether presenta IA médica que se ejecuta en teléfonos, supera a los modelos SoTA mucho más grandes y puede eliminar la nube por completo