Cryptonews

Tether представляет медицинский искусственный интеллект, который работает на телефонах, превосходит гораздо более крупные модели SoTA и может полностью отказаться от облака

Source
CryptoNewsTrend
Published
Tether представляет медицинский искусственный интеллект, который работает на телефонах, превосходит гораздо более крупные модели SoTA и может полностью отказаться от облака

7 мая 2026 г. – Сегодня исследовательская группа Tether в области искусственного интеллекта запустила QVAC MedPsy, новый класс моделей медицинского языка, предназначенных для работы непосредственно на смартфонах, носимых устройствах и других устройствах с ограниченной вычислительной мощностью, обеспечивающих производительность, которая конкурирует, а в некоторых случаях превосходит значительно более крупные модели, оставаясь при этом локальными и частными. Вместо масштабирования производительности за счет размера модели система фокусируется на эффективности, снижая требования к вычислительным ресурсам и, как следствие, устраняя зависимость от удаленной облачной инфраструктуры.

Сегодня большинство систем по-прежнему зависят от крупных моделей, работающих на удаленных серверах, требующих передачи конфиденциальных данных через облачный сервер. В здравоохранении это включает в себя записи пациентов, диагностические запросы и клинические записи, причем все это подлежит строгим ограничениям конфиденциальности и соответствия требованиям. По мере того, как рынок растет с примерно 36 миллиардов долларов сегодня до прогнозов, превышающих 500 миллиардов долларов к 2033 году, такую ​​архитектуру становится все труднее обосновать.

Этот выпуск бросает вызов одному из самых укоренившихся предположений в области искусственного интеллекта: для повышения производительности требуются более крупные модели и больше вычислений. Вместо этого QVAC MedPsy переворачивает эту модель. Модель с 1,7 миллиарда параметров набрала средний балл 62,62 по семи закрытым медицинским тестам, превзойдя Google MedGemma-1.5-4B-it на 11,42 балла, несмотря на то, что она меньше половины размера. В реальных клинических сценариях, таких как HealthBench Hard, модель с 1,7 миллиардами даже превосходит MedGemma 27B, модель почти в шестнадцать раз большую. Наша версия QVAC MedPsy с 4 миллиардами параметров набрала 70,54 балла по тем же семи закрытым тестам, превысив почти в семь раз более крупные модели, включая MedGemma-27B-text, и продемонстрировала более высокую производительность в таких клинических оценках, как HealthBench Hard, HealthBench и MedXpertQA. В целом оценка охватывала восемь различных наборов эталонных тестов: MedQA-USMLE и MedMCQA для клинических знаний и медицинских осмотров; MMLU Health и MMLU-Pro Health для медицинской грамотности; MedXpertQA для экспертных клинических рассуждений; PubMedQA для понимания биомедицинских исследований; AfriMedQA для недостаточно обслуживаемых глобальных систем здравоохранения; и HealthBench, включая HealthBench Hard, для реальных клинических сценариев. Повышение производительности достигается за счет поэтапного медицинского процесса после обучения, который сочетает в себе широкий медицинский контроль, более ценные данные клинического обоснования и обучение с подкреплением, ориентированное на более сложные случаи медицинского обоснования.

Модели также значительно снижают стоимость вывода. Наша модель QVAC MedPsy 4B генерирует ответы примерно в 909 токенах по сравнению с 2953 токенами для сопоставимых систем, что означает сокращение в 3,2 раза, тогда как модель 1,7B в среднем составляет около 1110 токенов против 1901 токена, что означает сокращение в 1,7 раза. Это приводит к более быстрому реагированию и возможности запуска локально, не завися от облачной инфраструктуры. Модели также выпускаются в квантовых форматах GGUF для локального развертывания, при этом рекомендуемые версии Q4_K_M имеют размер примерно 1,2 ГБ для QVAC MedPsy-1.7B и 2,6 ГБ для QVAC MedPsy-4B. В ходе тестирования эти сжатые версии сохранили большую часть эталонной производительности, делая модели практичными для мобильных и периферийных сред.

Это меняет сферу применения медицинского ИИ. Системы, которые ранее требовали внешней обработки, могут быть развернуты для поддержки врачей в локальных системах для безопасной локальной обработки и анализа данных, на мобильных устройствах или в средах, где ограничения на подключение, задержку или конфиденциальность делают облачные модели непрактичными. Это также уменьшает одно из основных препятствий для внедрения в здравоохранении — необходимость перемещения конфиденциальных данных за пределы контролируемой среды.

«В QVAC MedPsy мы сосредоточились на повышении эффективности на уровне модели, а не на увеличении размера», — сказал Паоло Ардоино, генеральный директор Tether. "В наших тестах модель QVAC MedPsy с 1,7 миллиардами параметров превзошла более крупные системы, такие как MedGemma-4B, а наша 4-миллиардная модель превзошла результаты моделей почти в семь раз по размеру, используя при этом в три раза меньше токенов на ответ. Эта комбинация имеет значение, поскольку она напрямую снижает требования к вычислениям, задержку и стоимость. Это позволяет модели работать локально на стандартном оборудовании вместо того, чтобы полагаться на удаленную инфраструктуру. В здравоохранении это полностью меняет ограничения; вы можете запускать медицинские рассуждать там, где данные уже существуют, внутри больничной системы или на устройстве, без перемещения конфиденциальной информации через облако или ожидания внешней обработки».

За последнее десятилетие прогресс в области искусственного интеллекта был связан с доступом к облачным вычислениям. QVAC MedPsy указывает на другое направление, где эффективность, локальность и конфиденциальность определяют производительность. Если эти достижения сохранятся в реальных условиях, они могут изменить экономику медицинской инфраструктуры искусственного интеллекта, сместив преимущество в сторону систем, которые работают локально с меньшими затратами, меньшей задержкой и большим контролем над конфиденциальными данными.

Подробнее читайте на https://qvac.tether.io/models/.

О данных Tether

Tether Data, SA d

Tether представляет медицинский искусственный интеллект, который работает на телефонах, превосходит гораздо более крупные модели SoTA и может полностью отказаться от облака