Sora 2 de OpenAI lleva la generación de vídeos con IA un paso más allá: ahora tú eres el protagonista

Sora 2 permite introducir directamente elementos del mundo real en la herramienta de generación de vídeo

03/10/2025 14:21

Hasta la llegada de la inteligencia artificial, los vídeos eran la mejor manera de contrastar información. Aunque se podían manipular, era mucho más complejo de hacer que con las fotografías estáticas, pues se requería de conocimientos, un buen equipo y bastante tiempo para lograr un resultado mínimamente convincente. Pero desde que esta tecnología está al alcance de cualquiera con un ordenador y conexión a Internet, nadie está a salvo de las fake news y desinformación.

Tecnología

Al igual que es posible generar imágenes con IA, también lo es con vídeo. Existen varias herramientas dedicadas, siendo una de las más avanzadas Veo de Google. OpenAI, la compañía tras el popular bot conversacional ChatGPT, también tiene la suya propia: Sora. Aunque tuvo un lanzamiento polémico por no estar a la altura de las expectativas, la compañía capitaneada por Sam Altman (y cofundada junto a Elon Musk) ha solucionado muchos de sus problemas con Sora 2.

Aproximadamente un año y medio después de la salida de la primera versión (principios de 2024), la segunda generación de Sora parece haber avanzado lo suficiente en realismo, control creativo y precisión física en las escenas como para que los profesionales y usuarios más experimentados lo tengan en cuenta en sus próximos proyectos (preferiblemente, proyectos que no sean para hacer el mal).

Sora 2 llega acompañado de una app para iPhone con la que compartir los vídeos creados con IA

Como menciona OpenAI en el comunicado oficial, "(desde el modelo original) el equipo de Sora se ha centrado en entrenar modelos con capacidades de simulación del mundo más avanzadas. Creemos que estos sistemas serán cruciales para entrenar modelos de IA que comprendan a fondo el mundo físico". La compañía explica que Sora 2 puede hacer cosas "excepcionalmente difíciles, y en algunos casos, imposibles, para los modelos de generación de vídeos anteriores", refiriéndose a rutinas de gimnasia olímpica y otros deportes.

Uno de los principales problemas que tenía la versión original de Sora era generar vídeos con escenas dinámicas, como las mencionadas rutinas de gimnasia olímpica. En Internet circulan ejemplos en los que se ve a la gimnasta perder la cabeza o ganar una pierna durante las acrobacias. En las muestras proporcionadas por OpenAI de Sora 2, ya no ocurre esto (luego habrá que ver en pruebas realizadas por los usuarios).

El nuevo modelo también ha mejorado a la hora de seguir las instrucciones, pudiendo abarcar sin problema múltiples tomas con un gran nivel de precisión. Y no tienen que ser grabaciones cinematográficamente realistas, exclusivamente, sino que también se puede experimentar con el estilo anime. El límite está en la mente del usuario (y su habilidad para escribir instrucciones-prompts).

Algo especialmente curioso de Sora 2 es que los creadores de contenido pueden introducir directamente elementos del mundo real en la herramienta, como su propia imagen, con una representación precisa de su apariencia y voz. OpenAI afirma que funciona con cualquier ser humano, animal y objeto. En otras palabras: tú o tu mascota podéis ser los protagonistas del próximo bombazo "HollAIwood".

Para facilitar su uso, OpenAI ha lanzado una nueva aplicación para iOS de Sora que integra la tecnología de Sora 2. Con ella, los usuarios pueden crear o remezclar el contenido generado por el resto de los usuarios, y descubrir nuevos vídeos en un feed personalizado y aparecer con tus amigos mediante los cameos.

Esta es la app de la que escribimos recientemente en Urban Tecno. Algunos medios se refirieron a ella como una especie de "TikTok especializado en IA". En el comunicado se menciona que la app fue lanzada internamente la semana pasada para todos los trabajadores de OpenAI. Conociendo los peligros que entrañan las redes sociales, la compañía ha tomado una serie de medidas para intentar hacerla más segura:

"Ofrecemos a los usuarios herramientas y la opción de controlar lo que ven en su feed. Utilizando los amplios modelos de lenguaje existentes de OpenAI, hemos desarrollado una nueva clase de algoritmos de recomendación que puede configurarse mediante lenguaje natural. También contamos con mecanismos integrados para sondear periódicamente a los usuarios sobre su bienestar y ofrecerles la opción de ajustar su feed de forma proactiva".