Tecnologia

Deformações e cenas incríveis: testamos o Sora, que promete criar vídeos realistas, e a IA mostra suas falhas. Confira os resultados!

2025-01-03

Autor: João

Introdução ao Sora e suas capacidades

O vídeo em teste foi criado pelo GLOBO utilizando o Sora, a ferramenta desenvolvida pela OpenAI, responsável pelo ChatGPT. Essa nova tecnologia tem como objetivo produzir vídeos ultrarrealistas a partir de comandos textuais, tudo em questão de segundos. No entanto, ao solicitar a geração de uma cena com uma mulher pintando as unhas de vermelho, o resultado foi decepcionante.

Lançamento e preocupações sobre a ferramenta

O Sora foi oficialmente lançado em dezembro de 2024, após ser anunciado pela OpenAI em fevereiro do mesmo ano. A ferramenta é capaz de criar vídeos curtos, com duração de até 20 segundos, em três formatos: vertical, horizontal e quadrado. Desde sua apresentação, o aplicativo gerou preocupação sobre os possíveis riscos associados à sua utilização, especialmente no que diz respeito à disseminação de desinformação.

Resultados impressionantes, mas com limitações

Algumas das imagens criadas pelo Sora são realmente impressionantes e demonstram um alto nível de realismo e detalhes. Quando foi solicitado que a IA gerasse uma imagem aérea do Congresso americano, o resultado foi uma cena que poderia facilmente ser confundida com um vídeo real. Além disso, as amostras exibidas na aba "recentes" mostram produções de usuários que também são bastante convincentes.

Desafios na representação de movimentos humanos

No entanto, a ferramenta tem suas limitações, especialmente no que concerne aos movimentos humanos. Por exemplo, a tentativa de criar um vídeo de um "senhor cortando a unha do pé" resultou em um homem que, apesar de ter um rosto bem definido, parecia pincelar a perna com um objeto que se deformava de forma estranha. Já a cena de um bebê tocando a mão da mãe gerou uma confusão de formas, resultando em uma mão que parecia sair do pescoço da criança.

Erros na reprodução de arquitetura

A IA também encontrou dificuldades ao tentar reproduzir o icônico projeto do Congresso Nacional brasileiro, que possui duas cúpulas: uma convexa e outra côncava. Mesmo com uma descrição detalhada no comando, as cúpulas acabaram aparecendo voltadas para baixo.

Desafios com elementos naturais

Quando o tema são elementos naturais, a situação não melhora. Um pedido simples para gerar uma cena de uma onda gigante tocando a praia de Copacabana resultou em uma onda de apenas alguns metros e banhistas visivelmente confusos. Outro comando para gerar um vídeo de uma mulher mergulhando no mar na praia de Ipanema resultou em sequências que desafiam a lógica da gravidade.

Evolução futura da ferramenta

Apesar dos desafios enfrentados, a perspectiva é que o Sora, assim como outros modelos de IA generativa, continue a evoluir. Essa evolução se deve ao acúmulo de dados e ao refinamento contínuo através do uso. Recentemente, o Google também anunciou uma ferramenta concorrente chamada Veo 2, focada na criação de vídeos realistas, que ainda está na fase de testes.

Resultados variados em vários comandos

Os resultados de alguns comandos com o Sora foram variados: - Ao solicitar uma mulher entrando no mar na Praia de Ipanema, a resposta foi uma imagem que capturou a essência do verão, mas fugiu de algumas proporções realistas.

- Um pedido para criar uma cena de uma mulher pintando unhas gerou uma imagem que falhou em encaixar a perspectiva correta das mãos e objetos ao redor.

- O Congresso Nacional brasileiro ao pôr do sol foi representado com as torres se destacando, embora as cúpulas não tenham aparecido conforme o projeto original de Niemeyer.

- Uma cena de um palhaço triste perdeu a essência emocional por conta de detalhes mal representados.

- Uma imagem de um bebê segurando os dedos da mãe trouxe uma visão delicada, mas careceu de suavidade nas texturas.

- O pedido de um idoso cortando as unhas dos pés falhou em dar a intimidade desejada ao momento.

- A festa em uma laje durante um dia ensolarado resultou em uma imagem vibrante, embora um tanto confusa em suas sobreposições.

- A representação de ondas gigantescas quebrando nas praias do Rio foi incapaz de captar a gravidade da situação, faltando realismo e a magnitude do evento.

- Uma visão surreal de um panda triste capturando uma conexão emocional errônea, por conta de uma composição inusitada.

- Por fim, a cena do Carnaval em Olinda apresentava uma mistura colorida, mas careceu de um olhar mais aguçado para detalhes importantes na tradição carnavalesca.

Considerações finais

Esses resultados provam que, apesar do avanço da tecnologia de IA, ainda há muito a se aperfeiçoar antes que possamos confiar plenamente na criação de cenas realistas. O Sora, por enquanto, é uma ferramenta interessante, mas que levanta questões sobre a veracidade das imagens e vídeos gerados.