A Tencent, uma das principais empresas do setor de tecnologia da China, atualizou recentemente seu modelo de geração de vídeo DynamiCrafter, marcando um progresso significativo no domínio de vídeo generativo. Lançado no GitHub, o modelo de código aberto mostra o compromisso da Tencent com o avanço no espaço de transformação de texto em vídeo e de imagem em vídeo, um campo que está ganhando impulso após o sucesso da IA generativa em texto e imagens.
A última iteração do DynamiCrafter produz vídeos com uma resolução de 640×1024 pixels, dobrando a clareza da resolução de 320×512 da versão anterior. Esse desenvolvimento faz parte de uma tendência mais ampla entre os gigantes da tecnologia da China, incluindo ByteDance, Baidu e Alibaba, cada um trabalhando em seus modelos de difusão de vídeo para capitalizar o crescente interesse em conteúdo visual gerado por IA.
O que diferencia o DynamiCrafter é o uso de técnicas de difusão inspiradas em processos físicos, permitindo a transformação de legendas e imagens simples em vídeos complexos de segundos de duração. Essa abordagem difere significativamente dos métodos tradicionais que se concentram na animação de tipos específicos de movimento, como cenas naturais ou movimentos humanos. Em vez disso, o DynamiCrafter integra modelos de difusão de texto para vídeo com orientação de imagem, expandindo sua aplicação para uma variedade maior de conteúdo visual.
Demonstrações comparativas destacam a capacidade do DynamiCrafter de produzir mais conteúdo animado dinamicamente do que seus concorrentes, incluindo o Stable Video Diffusion e o Pika Labs. Embora esses avanços indiquem um progresso substancial, a tecnologia ainda está em seus estágios iniciais, sem perspectivas imediatas de gerar filmes completos.
DynamiCrafter
Demo: https://t.co/im9Jb6xH3y
model: https://t.co/jvp6qku3MN
Animating Open-domain Images with Video Diffusion Priors pic.twitter.com/sq3x3SMa5t
— AK (@_akhaliq) February 5, 2024
O impulso em direção à tecnologia de vídeo generativo reflete uma ambição mais ampla do setor de IA de explorar novas fronteiras além da geração de texto e imagem. A decisão da Tencent de abrir o código do DynamiCrafter se alinha a uma tendência crescente entre as empresas de tecnologia chinesas de envolver a comunidade global de desenvolvedores, compartilhando avanços e promovendo a inovação além das fronteiras. Essa abordagem colaborativa ressalta a natureza competitiva, porém cooperativa, da corrida global para liderar a criação de conteúdo orientado por IA.