Cryptonews

Microsoft (MSFT) presenta tres modelos patentados de IA en un importante cambio estratégico

Fuente
cryptonewstrend.com
Publicado
Microsoft (MSFT) presenta tres modelos patentados de IA en un importante cambio estratégico

Microsoft ejecutó el miércoles su movimiento más audaz hasta el momento en la carrera de la IA, al presentar tres modelos patentados que posicionan al gigante tecnológico como un rival directo de OpenAI, Google y las empresas emergentes de IA. Microsoft Corporation, MSFT Ahora se puede acceder al trío recién lanzado (MAI-Transcribe-1, MAI-Voice-1 y MAI-Image-2) a través de Microsoft Foundry y un MAI Playground dedicado. Estas herramientas abarcan reconocimiento de voz, síntesis de voz y generación de contenido visual. Mustafa Suleiman, director ejecutivo de inteligencia artificial de Microsoft, caracterizó el debut como el producto inaugural de su “equipo de superinteligencia”, establecido apenas seis meses antes. MICROSOFT ANUNCIÓ PLANES PARA DESARROLLAR MODELOS AVANZADOS DE IA PARA 2027. - First Squawk (@FirstSquawk) 2 de abril de 2026 Las acciones de MSFT experimentaron su trimestre más desafiante desde 2008, cayendo aproximadamente un 17% en lo que va del año. La introducción de este modelo marca la respuesta pública inicial de Suleiman a las demandas de los accionistas de obtener retornos significativos sobre inversiones sustanciales en IA. MAI-Transcribe-1 es la oferta insignia. Ofrece la tasa de error de palabras promedio más baja en el punto de referencia FLEURS para los 25 idiomas principales utilizados en los productos de Microsoft, registrando un promedio del 3,8 %. La compañía afirma que supera el rendimiento Whisper-large-v3 de OpenAI en los 25 idiomas y supera a Gemini 3.1 Flash de Google en 22 de 25. El sistema maneja archivos MP3, WAV y FLAC de hasta 200 MB, con velocidades de procesamiento por lotes 2,5 veces más rápidas que las soluciones actuales de Azure. Ya se están realizando pruebas en Teams y Copilot Voice. MAI-Voice-1 produce 60 segundos de salida de audio realista en solo un segundo y permite la generación de voz personalizada a partir de muestras de audio mínimas que duran solo unos segundos. El precio está fijado en 22 dólares por millón de caracteres. MAI-Image-2 consiguió una de las tres primeras posiciones en la clasificación de Arena.ai y se está integrando en Bing y PowerPoint, con un precio de 5 dólares por millón de tokens de entrada y 33 dólares por millón de tokens de salida de imágenes. WPP se ha convertido en una de las primeras empresas en adoptar la tecnología a escala. El lanzamiento de este producto no podría haber ocurrido doce meses antes. Hasta octubre de 2025, Microsoft enfrentó restricciones contractuales que impedían el desarrollo independiente de inteligencia artificial general en virtud de su acuerdo OpenAI original de 2019. Cuando OpenAI buscó recursos informáticos adicionales más allá de Microsoft (estableciendo asociaciones con SoftBank y otros), Microsoft inició renegociaciones de contratos. El acuerdo actualizado permite a Microsoft desarrollar modelos de frontera propietarios manteniendo los derechos de licencia sobre los desarrollos de OpenAI hasta 2032. Suleiman explicó a VentureBeat: "En septiembre del año pasado, renegociamos el contrato con OpenAI, y eso nos permitió desarrollar de forma independiente nuestra propia superinteligencia". Hizo hincapié en que la asociación con OpenAI continúa al menos hasta 2032. Entre las revelaciones más sorprendentes del anuncio: equipos de desarrollo de menos de 10 ingenieros crearon cada modelo. Suleiman indicó que el equipo del modelo de audio estaba formado por 10 personas, y que las mejoras de rendimiento surgieron de elecciones arquitectónicas y curación de datos en lugar de expansión de la fuerza laboral. “Nuestro equipo de imagen, igualmente, es de menos de 10 personas”, anotó. Esta metodología contrasta marcadamente con las prácticas prevalecientes en la industria, donde organizaciones como Meta supuestamente han extendido paquetes de compensación a investigadores individuales que van desde $100 millones a $200 millones. Microsoft enfatiza sus precios intencionalmente competitivos, estructurados para socavar a Amazon y Google. Suleiman lo calificó como "el más barato de todos los hiperescaladores". La organización ya está planificando implementaciones de clústeres de GPU a escala fronteriza durante los próximos 12 a 18 meses. Suleiman validó que aparece un gran modelo de lenguaje en la hoja de ruta de desarrollo, afirmando que Microsoft apunta a volverse "completamente independiente" y al mismo tiempo ofrecer "modelos de última generación en todas las modalidades".