MAI-Voice-1 y MAI-1-preview: la apuesta de Microsoft por su propia inteligencia artificial

La Casa Blanca condiciona la ayuda económica a que la empresa mantenga su división de fundición pese a sus malos resultados.

MAI-Voice-1 y MAI-1-preview: la apuesta de Microsoft por su propia inteligencia artificial
Publicado en Tecnología
Por por Alex Verdía

Microsoft ha dado un paso que muchos esperaban: estrenar sus primeros modelos de inteligencia artificial desarrollados internamente, sin depender de socios externos como OpenAI. La compañía anunció dos novedades: MAI-Voice-1, un modelo de voz con un rendimiento sorprendente, y MAI-1-preview, una versión preliminar de lo que podrían ser sus próximos grandes modelos de texto.

El primero, MAI-Voice-1, es capaz de generar un minuto de audio en menos de un segundo usando solo una GPU. Una eficiencia que lo convierte en una herramienta ideal para aplicaciones cotidianas como narraciones de noticias o podcasts. De hecho, Microsoft ya lo emplea en funciones de Copilot como Copilot Daily, donde un presentador virtual relata las noticias del día, y en explicaciones en formato de charlas estilo pódcast. Además, está disponible para pruebas en Copilot Labs, donde cualquier usuario puede elegir qué quiere que la IA diga y ajustar tanto la voz como el estilo de narración.

Por su parte, MAI-1-preview representa un paso más ambicioso. Se trata de un modelo de texto entrenado con alrededor de 15.000 GPUs Nvidia H100, diseñado para seguir instrucciones y dar respuestas útiles a consultas cotidianas. Aunque de momento está en fase experimental, ya se está probando en la plataforma de evaluación LMArena, y Microsoft asegura que pronto se integrará en Copilot para casos de uso de texto, que actualmente siguen funcionando sobre modelos de OpenAI.

El giro de Microsoft: menos empresa, más consumidor

Lo más llamativo de esta estrategia es que Microsoft no está pensando en grandes clientes corporativos ni en entornos empresariales, al menos por ahora. Mustafa Suleyman, responsable de Microsoft AI, ya lo adelantaba en una entrevista el año pasado: “Tenemos que crear algo que funcione extremadamente bien para el consumidor y optimizar para nuestro propio uso. Contamos con enormes cantidades de datos predictivos y útiles en el lado publicitario y de la telemetría de consumo. Mi foco está en modelos que funcionen como compañeros para el usuario”.

Esa visión se traduce en un cambio de rumbo: mientras muchos rivales apuestan por modelos gigantescos y multisectoriales, Microsoft parece inclinarse hacia un ecosistema de modelos especializados, cada uno ajustado a una necesidad concreta. MAI-Voice-1 es un ejemplo claro: rápido, ligero y útil para casos de voz. MAI-1-preview, aunque más pesado, busca integrarse en Copilot para responder a dudas y acompañar al usuario en tareas cotidianas.

En su blog oficial, la compañía lo resume con ambición: “Creemos que orquestar una gama de modelos especializados, adaptados a diferentes intenciones y casos de uso, desbloqueará un valor inmenso”. Un mensaje que deja claro que este movimiento no es un experimento aislado, sino el comienzo de una estrategia más amplia para reforzar su independencia tecnológica.

En definitiva, la llegada de MAI-Voice-1 y MAI-1-preview marca el inicio de una etapa en la que Microsoft busca equilibrar su colaboración con OpenAI con una mayor autonomía en el desarrollo de IA. Para los usuarios, significa nuevas funciones en Copilot que prometen ser más rápidas, adaptadas y cercanas a la experiencia de consumo masivo. Y para la industria, una señal de que la batalla por la próxima generación de modelos de inteligencia artificial apenas acaba de empezar.

Para ti
Queremos saber tu opinión. ¡Comenta!