Carolina Parada, jefa de robótica en Google DeepMind, menciona la importancia de los nuevos modelos IA: "permite construir robots más capaces, con mayor capacidad de respuesta"

Carolina Parada fue una figura clave en el desarrollo del reconocimiento de voz de Google

Publicado en Robótica

13/03/2025 19:00

Google adquirió en el año 2014 la empresa británica especializada en inteligencia artificial DeepMind, enfocada en el desarrollo de algoritmos avanzados y modelos de aprendizaje automático. El objetivo de la compañía es la creación de IA capaz de resolver problemas complejos de manera autónoma, centrándose en el aprendizaje profundo y refuerzo, así como en las ciencias y matemáticas, juegos y simulaciones, y la salud.

La compañía, que forma parte de Alphabet, Inc. acaba de presentar dos nuevos modelos diseñados para robótica. Estos modelos están basados en Gemini 2.0, que está construido para la nueva era de los agentes de IA. Son varias las compañías que están desarrollando este tipo programas, entre ellas, OpenAI, Microsoft y Manus.

La persona encargada de anunciar los nuevos modelos es Carolina Parada, una ingeniera e investigadora especializada en inteligencia artificial que, actualmente, es directora Senior y líder de Robótica en Google DeepMind, donde supervisa el desarrollo de tecnologías avanzadas para la movilidad y percepción de robots en entornos centrados en humanos. Asegura que los nuevos modelos de IA "permiten construir robots más capaces".

Así son los nuevos modelos de IA de Google DeepMind

Los nuevos modelos de inteligencia artificial de DeepMind son geniales para robots

Los nuevos modelos de inteligencia artificial están diseñados para ayudar a los robots a realizar una gama más amplia de tareas en el mundo real. El primero de los modelos se llama Gemini Robotics, el cual es un modelo de visión, lenguaje y acción capaz de comprender nuevas situaciones, incluso sin haber sido entrenado en ellas.

Durante la rueda de prensa del anuncio de los nuevos modelos, Carolina Parada afirmó que Gemini Robotics "se basa en la comprensión multimodal del mundo de Gemini y la traslada al mundo real, añadiendo acciones físicas como una nueva modalidad". Como han querido dejar claro, el nuevo modelo avanza en tres áreas clave que, según Google DeepMind, son esenciales para construir robots útiles: generalidad, interactividad y destreza.

Por si fuera poco, es capaz de realizar tareas físicas más precisas, como doblar un trozo de papel o quitar la tapa de una botella. "Si bien hemos avanzado en cada una de estas áreas individualmente en el pasado con la robótica general, estamos logrando un rendimiento drásticamente mayor en las tres áreas con un solo modelo".

Esto nos permite construir robots más capaces, con mayor capacidad de respuesta y más resistentes a los cambios en su entorno

El otro modelo que Google DeepMind ha anunciado es Gemini Robotics-ER. La compañía lo describe como un modelo avanzado de lenguaje visual que puede "comprender nuestro mundo complejo y dinámico". Está diseñado para que los especialistas en robótica se conecten con los controladores de bajo nivel existentes, lo que permite habilitar nuevas capacidades.

La trayectoria de Carolina Parada es impresionante. Además de ser una figura clave en Google DeepMind, también dirigió el equipo de percepción por cámara para vehículos autónomos de NVIDIA, mejorando los sistemas de visión en vehículos sin conductor, y fue la responsable del desarrollo de tecnologías de reconocimiento de voz del gigante de Internet, contribuyendo a la activación por voz de "OK, Google" y Google Assistant.