Cryptonews

Microsoft (MSFT) представляет три собственные модели искусственного интеллекта в рамках крупного стратегического сдвига

Источник
cryptonewstrend.com
Опубликовано
Microsoft (MSFT) представляет три собственные модели искусственного интеллекта в рамках крупного стратегического сдвига

В среду Microsoft предприняла свой самый смелый шаг в гонке ИИ, представив три запатентованные модели, которые позиционируют технологического гиганта как прямого конкурента OpenAI, Google и новых компаний, занимающихся ИИ. Корпорация Microsoft, MSFT Недавно выпущенное трио — MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2 — теперь доступно через Microsoft Foundry и специальную площадку MAI Playground. Эти инструменты включают в себя распознавание речи, синтез голоса и генерацию визуального контента. Мустафа Сулейман, генеральный директор Microsoft по искусственному интеллекту, охарактеризовал этот дебют как первый продукт своей «суперразведывательной команды», созданной всего шесть месяцев назад. MICROSOFT ОБЪЯВИЛА О ПЛАНАХ РАЗРАБОТКИ ПЕРЕДОВЫХ МОДЕЛЕЙ ИИ К 2027 ГОДУ. — First Squawk (@FirstSquawk) 2 апреля 2026 г. Акции MSFT пережили самый сложный квартал с 2008 года, снизившись примерно на 17% с начала года. Представление этой модели знаменует собой первый публичный ответ Сулеймана на требования акционеров о значимой прибыли от значительных инвестиций в искусственный интеллект. MAI-Transcribe-1 является флагманским предложением. Он обеспечивает самый низкий средний уровень ошибок в словах по тесту FLEURS для 25 основных языков, используемых в продуктах Microsoft, в среднем 3,8%. Компания утверждает, что она превосходит производительность OpenAI Whisper-large-v3 на всех 25 языках и превосходит Google Gemini 3.1 Flash в 22 из 25. Система обрабатывает файлы MP3, WAV и FLAC размером до 200 МБ, причем скорость пакетной обработки в 2,5 раза выше, чем у текущих решений Azure. Тестирование уже ведется в Teams и Copilot Voice. MAI-Voice-1 воспроизводит 60 секунд реалистичного звука всего за одну секунду и позволяет генерировать индивидуальный голос из минимальных аудиосэмплов продолжительностью всего несколько секунд. Цена установлена ​​на уровне 22 долларов за миллион символов. MAI-Image-2 занял первое место в таблице лидеров Arena.ai и интегрируется в Bing и PowerPoint по цене 5 долларов за миллион входных токенов и 33 доллара за миллион выходных токенов изображений. WPP стала одним из первых предприятий, внедривших эту технологию в больших масштабах. Запуск этого продукта не мог произойти двенадцать месяцев назад. До октября 2025 года Microsoft сталкивалась с договорными ограничениями, препятствующими независимой разработке общего искусственного интеллекта в соответствии с первоначальным соглашением OpenAI 2019 года. Когда OpenAI потребовала дополнительных вычислительных ресурсов помимо Microsoft — установив партнерские отношения с SoftBank и другими, — Microsoft инициировала пересмотр контракта. Обновленное соглашение позволяет Microsoft разрабатывать собственные передовые модели, сохраняя при этом лицензионные права на разработки OpenAI до 2032 года. Сулейман объяснил VentureBeat: «Еще в сентябре прошлого года мы пересмотрели контракт с OpenAI, и это позволило нам самостоятельно заниматься собственным сверхразумом». Он подчеркнул, что партнерство OpenAI продлится как минимум до 2032 года. Среди наиболее ярких открытий этого объявления: каждую модель создавали команды разработчиков, насчитывающие менее 10 инженеров. Сулейман отметил, что команда аудиомоделей состоит из 10 человек, причем улучшение производительности связано с архитектурным выбором и курированием данных, а не с расширением штата сотрудников. «Наша имидж-команда тоже насчитывает менее 10 человек», — отметил он. Эта методология резко контрастирует с преобладающей отраслевой практикой, где такие организации, как Meta, предположительно расширили компенсационные пакеты отдельных исследователей в пределах от 100 до 200 миллионов долларов. Microsoft подчеркивает, что ее намеренно конкурентоспособные цены созданы для того, чтобы подорвать позиции Amazon и Google. Сулейман назвал его «самым дешевым из всех гиперскейлеров». Организация уже планирует масштабное развертывание кластеров графических процессоров на ближайшие 12–18 месяцев. Сулейман подтвердил, что в дорожной карте разработки появляется большая языковая модель, заявив, что Microsoft стремится стать «полностью независимой», одновременно предоставляя «современные модели во всех модальностях».