OpenAI abre para o público a Sora, IA capaz de criar incríveis deepfakes

Criadora do ChatGPT está testando um recurso que permite inserir pessoas reais nos vídeos gerados por seu novo modelo

Crédito: OpenAI

Mark Wilson 4 minutos de leitura

Em fevereiro, a OpenAI apresentou a Sora, uma poderosa ferramenta de criação de vídeos que transforma comandos de texto em cenas completas. Agora, a plataforma está oficialmente disponível para o público.

Incluída nas assinaturas do ChatGPT por US$ 20/mês, a Sora permite criar vídeos de alta definição com até 20 segundos de duração apenas descrevendo o que você imagina. Além disso, suas funcionalidades e sua interface vão muito além da simplicidade do chatbot.

Um dos recursos mais inovadores, atualmente disponível apenas para um pequeno grupo de teste, é a possibilidade de integrar imagens reais de pessoas em cenários fictícios.

A OpenAI, no entanto, ainda está avaliando se esse recurso será liberado para todos. “Estamos conduzindo testes por um período antes de tomar uma decisão”, explica Rohan Sahai, líder de produto da Sora.

Durante a demonstração remota, fiquei impressionado com a interface sofisticada e a experiência intuitiva da plataforma – muito mais ricas em comparação com as do ChatGPT em seu lançamento. O equilíbrio entre os poderosos recursos de personalização e a usabilidade é evidente.

Além de comandos de texto, a Sora oferece a possibilidade de importar mídias de referência e criar estilos visuais personalizados. Sua interface inicial lembra o Google Drive, com diretórios de projetos à esquerda e uma área de trabalho à direita. Também traz um feed com criações recentes da comunidade Sora, exibidas como um mural de inspiração visual.

Crédito: OpenAI

“Nosso objetivo era oferecer mais do que um feed social, mas também uma ferramenta educativa para ajudar os usuários a explorar o potencial da Sora de forma eficaz”, explica Souki Mansoor, líder do programa artístico da plataforma.

Ao clicar em um vídeo no feed, os usuários não só podem assisti-lo, como também conferir os comandos e métodos usados para produzi-lo, podendo, inclusive, fazer alterações e remixar o conteúdo – como uma espécie de “TikTok da IA”.

O conjunto de ferramentas disponíveis se assemelha às de softwares como Adobe Premiere e iMovie. Assim que inicia a geração de um vídeo, a plataforma exibe uma linha do tempo com um storyboard, detalhando cada etapa do que está sendo criado.

Crédito: OpenAI

Durante o último ano, a OpenAI conduziu um teste beta fechado, com criativos de várias partes do mundo, para refinar os recursos da Sora. Um dos projetos de destaque foi o clipe da música “My Love, da banda canadense Shy Kids. 

Criado em apenas duas semanas, o vídeo retrata a amizade de dois macacos em uma floresta tropical, culminando em uma triste reviravolta. Todo o trabalho foi feito praticamente apenas com a Sora, com apenas alguns retoques mínimos de edição e correção de cor.

Enquanto trabalhava com criativos, a OpenAI também testava os limites do sistema com uma equipe de “red teamers” para identificar possíveis usos indevidos antes do lançamento oficial.

A segurança da Sora é reforçada por uma “pilha de proteção”, construída com base na experiência da empresa com o ChatGPT e o Dall-E. Todas as solicitações são monitoradas para evitar a criação de conteúdos violentos ou impróprios.

“Nossa prioridade é equilibrar a criatividade com a segurança”, explica Sahai. “Adotamos uma abordagem extremamente cautelosa para impedir violações, como revenge porn [pornografia de vingança] e abuso infantil. Sabemos que, no início, algumas pessoas acharão as restrições rigorosas demais, mas vamos ajustá-las ao longo do tempo.”

Crédito: Minne Atairu/ OpenAI

Outras medidas incluem o bloqueio automático do uso de rostos de celebridades e figuras públicas, supervisão humana e marcas d’água invisíveis em todos os vídeos para garantir rastreabilidade. 

Além disso, usos abusivos e violações de direitos autorais resultarão em banimento. “Estamos tratando isso como um experimento”, enfatiza Sahai. “O acesso está limitado a um grupo pequeno para monitorarmos os resultados de perto.”

Crédito: OpenAI

Pessoalmente, fico menos preocupado com a possibilidade de revenge porn – que pode ser mitigada com medidas de segurança suficientes – e mais com a falta de consentimento das pessoas para ter suas imagens usadas por qualquer um. Acredito que uma abordagem mais responsável seria oferecer opções rígidas de aceitação (opt-in) ou recusa (opt-out).

Com o opt-in, os artistas só poderiam gerar vídeos deles mesmos, por exemplo. Ou a pessoa poderia simplesmente acessar a OpenAI e solicitar que sua imagem não fosse usada (opt-out). Mas essa possibilidade traria algumas complicações, pois exigiria que a empresa analisasse as imagens de cada rosto inseridas no sistema.

O fato é que Sora já está disponível. A realidade se foi – para sempre.


SOBRE O AUTOR

Mark Wilson é redator sênior da Fast Company. Escreve sobre design, tecnologia e cultura há quase 15 anos. saiba mais