¿Podría predecirse el futuro? Es lo que quiere hacer NVIDIA con su nueva tecnología

Cosmos Policy forma parte del ecosistema más amplio de NVIDIA, centrado en la creación de modelos mundiales de propósito general para robots y sistemas autónomos

Publicado en Robótica

08/02/2026 11:00

La NVIDIA de ahora no es la misma NVIDIA de hace veinte años. Aunque sigue presente en el sector gaming con sus tarjetas gráficas para jugar en PC, su negocio principal es el de los chips para inteligencia artificial. Este cambio de rumbo la ha llevado a convertirse en una de las compañías más importantes del mundo, por el simple hecho de que es la tecnología por la que más apuesta la industria. Y sin los productos de NVIDIA, los modelos de lenguaje grande y otras herramientas de IA no pueden avanzar.

Aparte de hardware, NVIDIA también se encarga de crear software dirigido a progresar en el desarrollo de la inteligencia artificial, con plataformas, bibliotecas y marcos de trabajo, como CUDA, cuDNN o TensorRT. El gigante estadounidense, para evitar quedarse atrás, está constantemente innovando y lanzando nuevos productos. El último es Cosmos Policy.

Cosmos Policy es un nuevo enfoque para el control de los robots (la robótica y la IA van unidas de la mano) que se basa en su impulso más amplio hacia modelos de base mundial para sistemas de inteligencia artificial físicos; es decir, los que puedan interactuar con el mundo real y no solo con entornos digitales (véase ChatGPT).

Cosmos Policy logró altas tasas de éxito en tareas que requieren razonamiento a largo plazo

El marco de Cosmos Policy está diseñado para simplificar la forma en que los robots deciden qué acciones realizar adaptando modelos de predicción de vídeo de gran tamaño para tareas de control y planificación. En robótica, una política (policy) es la capa de toma de decisiones que traduce observaciones, como las imágenes de cámaras y datos de sensores, en acciones físicas como movimientos articulares o de agarre.

Las políticas robóticas, tradicionalmente, se han construido como redes neuronales específicas para cada tarea, las cuales requieren módulos independientes de percepción planificación y control. Estos sistemas requieren de grandes cantidades de datos etiquetados y ajustes personalizados para cada robot o entorno.

Cosmos Policy tiene un enfoque distinto, ya que NVIDIA, en lugar de diseñar un nuevo modelo de control desde cero, entrena posteriormente un modelo de mundo de vídeo preentrenado (Cosmos Predict) con datos de demostración de robots. El modelo ya entiende cómo evoluciona el mundo físico a lo largo del tiempo, habiendo aprendido de datos de vídeo a gran escala.

El diseño de Cosmos Policy le permite predecir conjuntamente acciones, estados futuros y el éxito esperado de las tareas dentro de una misma arquitectura. Al confiar en una única etapa posterior al entrenamiento, el marco reduce la complejidad arquitectónica y evita la necesidad de unir múltiples modelos especializados para la percepción y el control.

En pruebas de referencia estándar de manipulación robótica, Cosmos Policy logró altas tasas de éxito en tareas de varios pasos que requieren razonamiento a largo plazo. En ciertos casos, igualó o superó el rendimiento de los métodos existentes utilizando muchas menos demostraciones de capacitación. Esto es especialmente importante en robótica, ya que la recopilación de datos de entrenamiento del mundo real es muy costoso, además de requerir mucho tiempo.

Cosmos Policy es parte del ecosistema más amplio de NVIDIA, centrado en la creación de modelos mundiales de propósito general para robots y sistemas autónomos. El objetivo es proporcionar una infraestructura compartida que ayude a las máquinas a comprender, predecir y actuar dentro del mundo físico, reduciendo la necesidad de ingeniería específica para cada tarea.