El generador de texto y vídeo Sora de OpenAI estará disponible para el público en 2024

¡La anticipación está creciendo alrededor de Sora! OpenAI está destinado a revolucionar una vez más el mundo de la inteligencia artificial con su generador de texto a vídeo, llamado Sora.

Mira Murati, CTO de OpenAI, anunció durante una entrevista con The Wall Street Journal que Sora estaría disponible para el público en general “este año”, destacando que su disponibilidad podría ser cuestión de unos meses. Inicialmente, OpenAI restringió el acceso a Sora a un grupo cerrado de investigadores y creadores, buscando descubrir y rectificar posibles fallas antes de una implementación más amplia.

Lo que está en juego en este cauteloso desarrollo es la necesidad de superar varios desafíos técnicos y éticos, ejemplificados recientemente por la controversia en torno a la IA Gemini de Google, que produjo imágenes históricamente inexactas, lo que provocó la indignación pública. Estos incidentes resaltan la importancia crítica de perfeccionar estas tecnologías antes de su introducción generalizada.

Revelado por primera vez en febrero, Sora tiene la capacidad de cree escenas hiperrealistas a partir de indicaciones de texto simples. Inicialmente, esta tecnología estaba reservada a artistas visuales, diseñadores y cineastas. Sin embargo, los vídeos generados por Sora llegaron rápidamente a varias plataformas online.

La intención de OpenAI no sólo es hacer que Sora sea accesible para todos, sino también eventualmente integrar una funcionalidad de audio para enriquecer aún más el realismo de las escenas generadas. Además, la empresa planea permitir a los usuarios modificar el contenido de los vídeos producidosuna flexibilidad necesaria ya que las herramientas de IA no siempre generan imágenes fieles a la realidad.

Un alto costo

En cuanto a los datos utilizados para entrenar a Sora, Murati se mostró evasiva, limitándose a mencionar que los datos provenían de fuentes públicas o autorizadas, confirmando únicamente el uso de contenido del socio de OpenAI, Shutterstock.

Murati también mencionó la alto costo de ejecutar Soraal tiempo que aseguró que el objetivo era hacer que la herramienta fuera financieramente accesible, análoga a DALL-E, el modelo de generación de imágenes de texto de OpenAI.

A medida que se acercan las elecciones presidenciales de 2024 en Estados Unidos, el impacto potencial de las herramientas de inteligencia artificial generativa en la creación de desinformación es una preocupación creciente. Cuando se lance, Sora debería implementar restricciones similares a las de DALL-E, incluida la imposibilidad de producir imágenes de personajes públicos, e integrar una marca de agua para diferenciar las creaciones de la realidad, a pesar de las limitaciones que esto pueda implicar.