Microsoft presenta un nuevo modelo de IA, pero no es solo para los humanos

Microsoft planea ampliar la disponibilidad de su modelo próximamente a través de su plataforma Foundry

Microsoft presenta un nuevo modelo de IA, pero no es solo para los humanos
Robot con Rho-alpha | Microsoft
Publicado en Robótica

Microsoft es una de las empresas que más apuesta por la inteligencia artificial a nivel mundial. Más allá de querer integrar su asistente Copilot en Windows 11 a gran escala, el gigante tecnológico hace unas semanas anunció una inversión de más de 17 mil millones de dólares en India para convertir al país asiático en una superpotencia en computación en la nube. Allí se concentra mucho talento tecnológico, así como acceso a Internet bastante generalizado (alrededor de mil millones de personas).

El gigante tecnológico se apoya mucho en socios para ofrecer soluciones avanzadas de IA. Por ejemplo, tiene acuerdos con OpenAI, la compañía tras el popular bot conversacional ChatGPT. No obstante, también desarrolla sus propios modelos de lenguaje, con el objetivo de depender cada vez menos de acuerdos con terceros actores.

Los responsables de la suite de ofimática más utilizada en todo el mundo (ahora bajo el servicio de suscripción Microsoft 365) cuentan con la familia de modelos abiertos Phi, que ofrecen soluciones de IA rentables y de alto rendimiento en el perímetro, lo que impulsa los límites de la inteligencia artificial generativa. Basados en ellos, la compañía ha desarrollado uno nuevo orientado a robots con dos manos.

Un modelo para permitir a los agentes de IA a interactuar directamente con el mundo real

El recién presentado modelo de Microsoft busca impulsar a los robots más allá de los entornos controlados de fábrica. Llamado Rho-alpha, aborda uno de los problemas cruciales de esta tecnología: las dificultades para adaptarse a entornos reales impredecibles. Derivado de su familia de inteligencia artificial de lenguaje de visión Phi, es el primer modelo de Microsoft centrado en la robótica.

Para Microsoft, este modelo supone un gran paso para hacer que la inteligencia artificial se vuelva más «física», permitiendo a los agentes inteligentes interactuar directamente con el mundo real, y no solo operar en espacios digitales, como ChatGPT o Copilot. A diferencia de los robots industriales tradicionales, Rho-alpha no se basa en secuencias de comandos de tareas rígidas, sino que traduce instrucciones de lenguaje natural en señales de control para robots que realizan tareas complejas de manipulación a dos manos.

Ashley Llorens, vicepresidente corporativo y director general de Microsoft Research (la división de investigación de Microsoft destinada a resolver problemas complejos de computación y otros productos a través de la IA, algoritmos, lingüística computacional, visión por computadora y minería de datos, entre otros), afirmó que la robótica se ha quedado históricamente rezagadas respecto al progreso de la inteligencia artificial del lenguaje y la visión.

Rho-alpha permite a los robots ajustar sus movimientos basándose en el tacto, en lugar de depender únicamente de la información visual. Microsoft planea añadir detección de fuerza y otras modalidades en futuras versiones. Además, puede cambiar su comportamiento durante la operación en lugar de depender únicamente de respuestas preentrenadas. Cuando el robot comete un error, los operadores humanos pueden intervenir mediante herramientas intuitivas como dispositivos de entrada 3D.

De momento, Rho-alpha se ofrecerá a través de un programa de acceso anticipado para investigación, aunque Microsoft planea ampliar la disponibilidad del modelo próximamente a través de su plataforma Foundry. La compañía ha conseguido superar el obstáculo de la escasez de datos de entrenamiento con demostraciones sintéticas, ya que permiten ampliar los conjuntos de datos de entrenamiento sin requerir intervención humana constante.

Para ti
Queremos saber tu opinión. ¡Comenta!