尽管体积缩小了 87%，但微型 Tether 模型的性能仍优于 Google 同类模型

USDT 稳定币背后的公司 Tether 于 2026 年 5 月发布了两款用于医疗用途的人工智能 (AI) 模型。这些模型是 Tether 的 QVAC AI 团队的一部分。 QVAC 是一种去中心化、本地优先的人工智能框架，直接在用户设备上运行。这些模型被命名为 MedPsy-1.7B 和 MedPsy-4B。这些数字指的是每个模型的大小，以数十亿个参数来衡量。参数是人工智能模型用于处理和生成响应的内部值。

模型无需互联网连接即可运行两种 MedPsy 模型均无需将数据发送到远程服务器即可运行。这称为设备上或本地推理。 QVAC 的 SDK 发布材料指出，当网络不可用时，基于 QVAC 构建的应用程序仍可继续运行。

“如果互联网出现故障，人工智能仍能继续工作。”，2026 年 5 月。 — QVAC / Tether，SDK 发布材料，Tether Ltd.

MedPsy-1.7B 的得分超过了更大的 Google 模型 QVAC 在七个封闭式医疗基准中测量了这两个模型。基准测试是用于比较人工智能性能的标准化测试。 MedPsy-1.7B 平均得分为 62.62。 Google 的类似模型 MedGemma-1.5-4B-it 得分为 51.20。 MedPsy-1.7B 包含的参数不到其得分超过的 Google 模型的一半。这些数据来自 QVAC 自己于 2026 年 5 月 6 日发布的 Hugging Face 技术报告。截至该日期，独立实验室复制尚未完成。

MedPsy-4B 击败了拥有 270 亿参数的竞争对手较大的 MedPsy-4B 模型在相同的基准平均值上得分为 70.54。 Google 的 MedGemma-27B-text-it 得分为 69.95。 MedPsy-4B 包含大约 40 亿个参数。 MedGemma-27B 包含大约 270 亿个参数，使其大小近七倍。 QVAC 还在 HealthBench Hard 上测试了这两种模型，这是一个使用 CompassJudger 评估的独立医学推理基准。 MedPsy-4B 在那次测试中得分为 58.00。 MedGemma-27B-text-it 在同一测试中得分为 42.00。

适合移动设备的压缩文件大小 QVAC 以 GGUF 格式发布了模型，这是一种用于在消费类硬件上运行 AI 模型的文件类型。名为 Q4_K_M 的压缩版本将 MedPsy-4B 文件减少至 2.72 GB。 QVAC 的 Hugging Face 模型卡指出，这种压缩可将文件大小减少 69%，同时基准性能平均仅降低 0.81 点。 2026 年 5 月 6 日发布的 MedPsy-4B 模型卡直接证实了 2.72 GB 的数字。

“Q4_K_M 是最佳选择：尺寸减小 69% (2.72 GB)，AVG 分数仅损失 -0.81 分（相对 -1.12%），可以舒适地安装在高端移动和笔记本电脑设备上。”，2026 年 5 月 6 日。 — QVAC 研究团队，Tether AI Group

Tether 报告 2026 年第一季度利润为 10.4 亿美元 Tether 自 2026 年 4 月 30 日起发布了 2026 年第一季度财务证明。证明是由外部审计师（在本例中为 BDO 公司）进行的财务审查。报告显示，该季度净利润为 10.4 亿美元。 Tether 在其负债之上持有 82.3 亿美元的储备缓冲。代币相关负债总额达到 1835 亿美元。该公司持有约 1,412 亿美元的美国国库券（短期政府债务工具）的直接和间接风险敞口。两种 MedPsy 模型都无需将数据发送到远程服务器即可运行。这称为设备上或本地推理。 QVAC 的 SDK 发布材料指出，当网络不可用时，基于 QVAC 构建的应用程序仍可继续运行。

“如果互联网出现故障，人工智能仍能继续工作。”，2026 年 5 月。 — QVAC / Tether，SDK 发布材料，Tether Ltd.