El nuevo modelo de lenguaje con IA de Microsoft puede competir contra GPT-4 y Gemini

La compañía estadounidense quiere comenzar un camino paralelo en la búsqueda de nuevos horizontes para la inteligencia artificial

07/05/2024 13:00

A pesar de que la aventura en el campo de la inteligencia artificial por parte de Microsoft ha ido íntimamente relacionada con la compañía OpenAI, la empresa de Redmond busca abrir nuevas posibilidades a través de la creación de su propio modelo de lenguaje de gran tamaño, uno que podría llegar a competir con modelos ya bien establecidos, como sería el caso de GPT-4, propiedad de OpenAI, o de Gemini, a cargo de Google.

Tecnología

MAI-1 es el modelo de lenguaje de gran tamaño de Microsoft

La noticia ha sido avanzada por el medio The Information recientemente y expone cómo Microsoft estaría trabajando en un modelo de lenguaje al que han denominado MAI-1. Podríamos afirmar que Microsoft busca establecer su propio territorio de IA, al margen de su trabajo junto con OpenAI, empresa responsable del conocido ChatGPT.

Detrás del desarrollo de este nuevo modelo de inteligencia artificial se encuentra Mustafa Suleyman, quien fuese cofundador y director de DeepMind, compañía inglesa de investigación y desarrollo de inteligencia artificial adquirida en 2014 por Alphabet Inc. Después de su paso por Google, Mustafa creó la compañía Inflection, entidad que ha desarrollado hardware y aplicaciones de inteligencia artificial generativa y aprendizaje automático.

Imagen de Mustafa Suleyman, responsable del desarrollo del nuevo modelo de IA de Microsoft

Parece que el modelo MAI-1 de Microsoft no es un simple 'copia y pega' de los modelos creados en Inflection, sino que ha sido creado desde cero, aunque con técnicas ya utilizadas en dicha compañía. El nuevo LLM de Microsoft tiene 500.000 millones de parámetros, siendo mucho más grande que algunos de los modelos previos creados por Microsoft, como podría ser el caso de Phi-3.

Es por ello que MAI-1 necesitará de mucha mayor capacidad de computación y de mucho más entrenamiento de lo que nunca antes se había realizado en el seno de la empresa norteamericana. Por el momento, el medio The Information asegura que este nuevo modelo podría competir contra GPT-4 y que, además, resulta ser algo superior a los LLM de Meta y Mistral, que llegan a los 70.000 millones de parámetros.

En la actualidad, existen dos tipos de aproximaciones a la inteligencia artificial, pudiendo ejecutarse algunos modelos de manera local o bien confiando en aquellos LLM que están confinados en la nube. Parece que Microsoft quiere diversificar su apuesta por esta tecnología, ayudándose de OpenAI para tareas en la nube y confiando en MAI-1 para nuevos desafíos.

Eso sí, por el momento no se ha desvelado qué usos se le darán a este nuevo modelo de lenguaje de gran tamaño, aunque sí sabemos que se están utilizando GPUs de Nvidia para entrenar a MAI-1 y que Microsoft podría desvelar sus primeros pasos con el modelo en la próxima conferencia de desarrolladores, que tendrá lugar este mismo mes de mayo.