Runway Gen-4.5 IA supera Google e OpenAI em vídeos

A startup de inteligência artificial Runway anunciou o lançamento do Gen-4.5, um novo modelo de vídeo que supera os modelos de vídeo de IA similares do Google e da OpenAI em um importante teste independente. O Gen-4.5 alcançou o primeiro lugar no ranking do Video Arena leaderboard, que é mantido pela empresa independente de análise e avaliação de IA, Artificial Analysis.
O que é o Gen-4.5?
O Gen-4.5 é um modelo de IA de vídeo que permite aos usuários gerar vídeos em alta definição a partir de instruções escritas que descrevem o movimento ou a ação desejada. A Runway afirma que o modelo é capaz de entender física, movimento humano, movimentação de câmera e relações de causa e consequência.
A empresa diz que o novo modelo oferece precisão sem precedentes na representação física, na consistência temporal e na capacidade de controlar ações dinâmicas em múltiplos modos de geração.
Veja também:
Como o Gen-4.5 superou o Google e a OpenAI?
Para determinar a classificação dos modelos de texto para vídeo, usuários comparam duas saídas diferentes e votam em sua favorita sem saber quais empresas as produziram. O modelo Veo 3, do Google, aparece em segundo lugar no ranking, enquanto o Sora 2 Pro, da OpenAI, está na sétima posição.
O CEO da Runway, Cristóbal Valenzuela, disse à CNBC que a startup conseguiu superar empresas trilionárias com uma equipe de 100 pessoas. Ele também disse que é possível chegar à fronteira da tecnologia sendo extremamente focado e diligente. Valenzuela afirmou que o Gen-4.5 recebeu o codinome “David”, em referência à história bíblica de Davi e Golias.
Recursos e capacidades do Gen-4.5
A Runway também promete que todos os modos de controle já conhecidos — como Image to Video, Keyframes e Video to Video — estarão disponíveis no Gen-4.5.
Outro destaque é a versatilidade estética. O modelo agora trabalha com maior consistência entre estilos fotográficos, cinematográficos e até animações estilizadas, mantendo um “vocabulário visual” coerente em diferentes cenários.
A empresa diz que o avanço se estende à dinâmica de fluidos, renderização de superfície e detalhes finos, como texturas de cabelo e tecido, que agora mantêm a coerência entre o movimento e o tempo.
Limitações
Apesar dos avanços, a Runway reconhece que existem limitações. Pode haver falhas, especialmente em situações onde a lógica causal é comprometida. Um exemplo disso é quando um objeto parece agir antes da causa, como uma porta abrindo antes de alguém tocar na maçaneta.
A Runway observa que o Gen-4.5 ainda enfrenta dificuldades com a causalidade. As portas podem se abrir antes que uma maçaneta seja empurrada, por exemplo. A permanência do objeto continua sendo um problema também, com itens desaparecendo após serem brevemente obscurecidos.
O modelo também mostra um forte “viés de sucesso”, fazendo com que as ações tenham sucesso com muito mais frequência do que deveriam, mesmo quando realisticamente falhariam, como um tiro mal direcionado.
Disponibilidade
O Gen-4.5 está sendo lançado gradualmente e deve estar disponível para todos os clientes da Runway até o final da semana.
O modelo Gen 4.5, apelidado internamente de “David”, estará acessível a todos os clientes da Runway até o final da semana através da sua plataforma, da sua API e de parceiros selecionados.
