Tether dévoile une IA médicale qui fonctionne sur les téléphones, surpasse les modèles SoTA beaucoup plus grands et peut complètement supprimer le cloud

7 mai 2026 – Le groupe de recherche sur l'IA de Tether a lancé aujourd'hui QVAC MedPsy, une nouvelle classe de modèles de langage médical conçus pour fonctionner directement sur les smartphones, les appareils portables et autres appareils dotés d'une puissance de traitement limitée, offrant des performances qui rivalisent et, dans certains cas, surpassent des modèles nettement plus grands tout en restant locaux et privés. Au lieu d'adapter les performances en fonction de la taille du modèle, le système se concentre sur l'efficacité, réduisant à la fois les besoins de calcul et, par conséquent, supprimant la dépendance à l'égard de l'infrastructure cloud distante.

Aujourd'hui, la plupart des systèmes dépendent encore de grands modèles exécutés sur des serveurs distants, ce qui nécessite le déplacement des données sensibles via un serveur cloud. Dans le domaine de la santé, cela inclut les dossiers des patients, les requêtes de diagnostic et les notes cliniques, tous soumis à des contraintes strictes de confidentialité et de conformité. Alors que le marché passe d’environ 36 milliards de dollars aujourd’hui à des projections dépassant les 500 milliards de dollars d’ici 2033, cette architecture devient de plus en plus difficile à justifier.

Cette version remet en question l’une des hypothèses les plus ancrées dans l’IA, selon laquelle de meilleures performances nécessitent des modèles plus gros et plus de calcul. Au lieu de cela, QVAC MedPsy inverse ce modèle. Un modèle de 1,7 milliard de paramètres a obtenu un score moyen de 62,62 sur sept références médicales fermées, surpassant de 11,42 points le MedGemma-1.5-4B-it de Google, bien qu'il soit inférieur de moitié. Dans des scénarios cliniques réels comme HealthBench Hard, le modèle de 1,7 milliard bat même MedGemma 27B, un modèle près de seize fois plus grand. Notre version QVAC MedPsy à 4 milliards de paramètres a obtenu un score de 70,54 sur les sept mêmes critères de référence fermés, dépassant les modèles près de sept fois plus grands, y compris MedGemma-27B-text, et a fourni des performances supérieures dans les évaluations de style clinique telles que HealthBench Hard, HealthBench et MedXpertQA. Dans l'ensemble, l'évaluation a couvert huit suites de référence diverses : MedQA-USMLE et MedMCQA pour les connaissances cliniques et les examens médicaux ; MMLU Health et MMLU-Pro Health pour la littératie en santé ; MedXpertQA pour un raisonnement clinique expert ; PubMedQA pour la compréhension de la recherche biomédicale ; AfriMedQA pour les contextes de santé mondiaux mal desservis ; et HealthBench, y compris HealthBench Hard, pour des scénarios cliniques réels. Les gains de performance proviennent d'un processus médical post-formation par étapes qui combine une large supervision médicale, des données de raisonnement clinique de plus grande valeur et un apprentissage par renforcement axé sur des cas de raisonnement médical plus difficiles.

Les modèles réduisent également considérablement le coût de l’inférence. Notre modèle QVAC MedPsy 4B génère des réponses dans environ 909 jetons, contre 2 953 jetons pour des systèmes comparables, soit une réduction de 3,2x, tandis que le modèle 1,7B génère en moyenne environ 1 110 jetons contre 1 901 jetons, soit une réduction de 1,7x. Cela se traduit par des temps de réponse plus rapides et la possibilité d'exécuter localement sans dépendre de l'infrastructure cloud. Les modèles sont également publiés dans des formats GGUF quantifiés pour un déploiement local, avec des versions Q4_K_M recommandées d'une taille d'environ 1,2 Go pour QVAC MedPsy-1.7B et 2,6 Go pour QVAC MedPsy-4B. Lors des tests, ces versions compressées ont conservé la plupart des performances de référence tout en rendant les modèles pratiques pour les environnements mobiles et périphériques.

Cela change les domaines dans lesquels l’IA médicale peut réellement être utilisée. Les systèmes qui nécessitaient auparavant un traitement externe peuvent être déployés pour aider les cliniciens au sein de systèmes sur site à assurer un traitement et une analyse sécurisés et locaux des données, sur des appareils mobiles ou dans des environnements où les contraintes de connectivité, de latence ou de confidentialité rendent les modèles basés sur le cloud peu pratiques. Cela réduit également l’un des principaux obstacles à l’adoption dans le secteur des soins de santé, à savoir la nécessité de déplacer les données sensibles en dehors des environnements contrôlés.

« Avec QVAC MedPsy, notre objectif était d'améliorer l'efficacité au niveau du modèle, plutôt que d'augmenter la taille », a déclaré Paolo Ardoino, PDG de Tether. "Lors de nos tests, le modèle QVAC MedPsy à 1,7 milliard de paramètres a surpassé les systèmes plus grands comme MedGemma-4B, et notre modèle à 4 milliards a dépassé les résultats de modèles près de sept fois sa taille, tout en utilisant jusqu'à trois fois moins de jetons par réponse. Cette combinaison est importante car elle réduit directement les besoins de calcul, la latence et les coûts. Elle permet au modèle de s'exécuter localement sur du matériel standard au lieu de s'appuyer sur une infrastructure distante. Dans le domaine de la santé, cela change complètement les contraintes ; vous pouvez exécuter un raisonnement médical là où les données existent déjà, à l'intérieur. un système hospitalier ou sur un appareil, sans déplacer d’informations sensibles via le cloud ni attendre un traitement externe.

Au cours de la dernière décennie, les progrès de l’IA ont été liés à l’accès au calcul basé sur le cloud. QVAC MedPsy pointe vers une direction différente, où l'efficacité, la localité et la confidentialité définissent la performance. Si ces gains se confirment dans les déploiements réels, ils pourraient remodeler l’économie de l’infrastructure de l’IA médicale, en déplaçant l’avantage vers des systèmes fonctionnant localement avec un coût moindre, une latence plus faible et un meilleur contrôle sur les données sensibles.

En savoir plus sur https://qvac.tether.io/models/

À propos des données Tether

Tether Data, S.A.d.