Blog

Sora, de OpenAI, va a revolucionar la creación de contenidos

¿Sora liderará la era del vídeo generativo?

Hace sólo unas semanas parecía imposible que una pregunta en lenguaje natural pudiera conducir a la creación de una película. Pero ahora que se ha presentado Sora, esta posibilidad parece más probable que antes. Si ChatGPT y DALL-E han cambiado la forma de crear textos e imágenes, esta nueva tecnología podría cambiar por completo la forma de hacer vídeos, lo que podría tener efectos en las industrias creativas y las escuelas audiovisuales.

Fundamentalmente, Sora funciona como un modelo de texto a vídeo, en el que los usuarios proporcionan información a modo de input textual y el modelo produce los correspondientes videos. Una de las características más impresionantes de Sora es su capacidad para generar vídeos casi reales a partir de entradas textuales. Estos vídeos pueden representar cualquier cosa, desde una mujer paseando por una ciudad hasta recreaciones históricas de pueblos durante la fiebre del oro.  OpenAI demostró varias de sus capacidades durante un avance de Sora, incluida la capacidad de dar vida a escenas vívidas en respuesta a señales textuales. Las creaciones de Sora, que van desde una concurrida calle de Tokio cubierta de nieve hasta un divertido arrecife de coral de papel, muestran una notable atención al detalle y una profunda comprensión de lo creativos que pueden ser los resultados de Sora. A pesar de pequeñas imperfecciones, como fallos ocasionales en la continuidad de las escenas o extraños posicionamientos de las manos, los resultados de Sora representan un importante avance en la narración basada en IA. 

‍A diferencia de los intentos anteriores de vídeo generativo, que se centraban principalmente en generar texto, superposiciones y efectos en lugar de animación de vídeo propiamente dicha, Sora destaca por su capacidad para producir vídeos de movimiento completo. Aunque aún no alcance la complejidad de producir largometrajes como «Up», su potencial es prácticamente ilimitado. Cineastas o dibujantes podrían utilizar Sora para visualizar conceptos, profesores para crear recreaciones históricas inmersivas y fabricantes para desarrollar prototipos y demostraciones.

Aunque las iteraciones actuales de Sora carecen de sonido, los avances en la generación de sonido y música por IA sugieren que esta función podría estar al caer. Aunque existen otros creadores de vídeo con IA generativa, Sora destaca por su capacidad para producir videos más largos con un nivel de realismo que lo diferencia de sus competidores. Lo que distingue a Sora no es sólo su capacidad para cumplir instrucciones textuales, sino su comprensión emergente de la gramática cinematográfica, que le permite crear narrativas convincentes con múltiples cambios de plano y ángulos de cámara dinámicos. Esta comprensión intrínseca de los principios de la narración abre nuevas posibilidades para la creación de contenidos y tiene el potencial de transformar plataformas de redes sociales como TikTok y los Reels de Instagram al permitir a los usuarios producir vídeos de alta calidad con el mínimo esfuerzo.

El mecanismo subyacente del funcionamiento de Sora refleja el de otros modelos generativos como DALL-E, que emplean un modelo de difusión que gradualmente refina el ruido aleatorio en imágenes que coinciden con las indicaciones proporcionadas. Lo que distingue a Sora es su comprensión de cómo los objetos de una escena interactúan entre sí de forma realista, por ejemplo simulando los efectos del agua o la gravedad en los movimientos. Esta comprensión de la dinámica del mundo real, probablemente obtenida tras un exhaustivo entrenamiento con horas de vídeo, permite a Sora crear vídeos que muestran un comportamiento coherente y realista.

Además, Worldcoin, una criptomoneda asociada a una iniciativa de identidad digital dirigida por Sam Altman, experimentó un aumento significativo de su valor de mercado, con un incremento del 40% sobre su valor anterior. El valor de Worldcoin ha subido desde que OpenAI lanzó Sora. Aunque Worldcoin y Sora son dos cosas diferentes, la subida del precio de Worldcoin sugiere un mayor interés de los inversores y un sentimiento positivo hacia Worldcoin dentro del mercado de criptomonedas. 

Sin embargo, un gran poder conlleva una gran responsabilidad. OpenAI reconoce los riesgos potenciales asociados a Sora, incluida la propagación de información errónea y los problemas de infracción de derechos de autor. La capacidad de crear vídeos convincentes a partir de indicaciones textuales abre vías para diversas formas de uso indebido, como estafas sofisticadas, creación de contenidos no consentidos y difusión de noticias falsas y desinformación. Para mitigar estos riesgos, OpenAI tiene previsto aplicar restricciones de contenido similares a las aplicadas a DALL-E 3, como la prohibición de la violencia, la pornografía y la apropiación de estilos de personas o artistas reales. Aunque OpenAI afirma su compromiso de integrar salvaguardias en sus algoritmos y colaborar con responsables políticos, educadores y artistas para abordar estos riesgos, el potencial de daño sigue siendo una preocupación acuciante. Además, la empresa proporcionará a los espectadores una forma de identificar los contenidos generados por IA, promoviendo la transparencia y la responsabilidad.

Al democratizar la creación de vídeos realistas, Sora tiene el potencial de empoderar a las personas en diversos ámbitos, desde la creación de contenidos hasta la narración de historias, al tiempo que impulsa un examen crítico del uso y la gobernanza responsables de la IA.

Artículos destacados

From offline to online.

Comparte tus ideas con nosotros