Tencent, uno de los principales actores de la industria tecnológica china, ha actualizado recientemente su modelo de generación de vídeo DynamiCrafter, marcando un avance significativo en el ámbito del vídeo generativo. Publicado en GitHub, el modelo de código abierto muestra el compromiso de Tencent de avanzar en el espacio de la transformación de texto a vídeo y de imagen a vídeo, un campo que está ganando impulso tras el éxito de la IA generativa en texto e imágenes.
La última iteración de DynamiCrafter produce vídeos con una resolución de 640×1024 píxeles, duplicando la claridad de la resolución de 320×512 de su versión anterior. Este desarrollo forma parte de una tendencia más amplia entre los gigantes tecnológicos chinos, como ByteDance, Baidu y Alibaba, cada uno de los cuales trabaja en sus modelos de difusión de vídeo para capitalizar el creciente interés por los contenidos visuales generados por IA.
Lo que diferencia a DynamiCrafter es su uso de técnicas de difusión inspiradas en procesos físicos, que permiten transformar simples pies de foto e imágenes en vídeos complejos de segundos de duración. Este enfoque difiere significativamente de los métodos tradicionales que se centran en animar tipos específicos de movimiento, como escenas naturales o movimientos humanos. En cambio, DynamiCrafter integra modelos de difusión de texto a vídeo con guía de imágenes, ampliando su aplicación a una gama más amplia de contenidos visuales.
Las demostraciones comparativas destacan la capacidad de DynamiCrafter para producir más contenido animado dinámicamente que sus competidores, incluidos Stable Video Diffusion y Pika Labs. Aunque estos avances indican un progreso sustancial, la tecnología está aún en sus primeras fases, sin perspectivas inmediatas de generar películas de larga duración.
DynamiCrafter
Demo: https://t.co/im9Jb6xH3y
model: https://t.co/jvp6qku3MN
Animating Open-domain Images with Video Diffusion Priors pic.twitter.com/sq3x3SMa5t
— AK (@_akhaliq) February 5, 2024
El impulso hacia la tecnología de vídeo generativo refleja una ambición más amplia dentro de la industria de la IA de explorar nuevas fronteras más allá de la generación de texto e imágenes. La decisión de Tencent de abrir el código de DynamiCrafter se alinea con una tendencia creciente entre las empresas tecnológicas chinas a implicar a la comunidad mundial de desarrolladores, compartiendo avances y fomentando la innovación más allá de las fronteras. Este enfoque colaborativo subraya la naturaleza competitiva pero cooperativa de la carrera mundial por liderar la creación de contenidos impulsada por la IA.