12-12-2024 | INTELIGÊNCIA ARTIFICIAL

OpenAI abre para o público a Sora, IA capaz de criar incríveis deepfakes

Criadora do ChatGPT está testando um recurso que permite inserir pessoas reais nos vídeos gerados por seu novo modelo

Crédito: OpenAI

Mark Wilson 4 minutos de leitura

Em fevereiro, a OpenAI apresentou a Sora, uma poderosa ferramenta de criação de vídeos que transforma comandos de texto em cenas completas. Agora, a plataforma está oficialmente disponível para o público.

Incluída nas assinaturas do ChatGPT por US$ 20/mês, a Sora permite criar vídeos de alta definição com até 20 segundos de duração apenas descrevendo o que você imagina. Além disso, suas funcionalidades e sua interface vão muito além da simplicidade do chatbot.

Um dos recursos mais inovadores, atualmente disponível apenas para um pequeno grupo de teste, é a possibilidade de integrar imagens reais de pessoas em cenários fictícios.

A OpenAI, no entanto, ainda está avaliando se esse recurso será liberado para todos. “Estamos conduzindo testes por um período antes de tomar uma decisão”, explica Rohan Sahai, líder de produto da Sora.

Veja também

Durante a demonstração remota, fiquei impressionado com a interface sofisticada e a experiência intuitiva da plataforma – muito mais ricas em comparação com as do ChatGPT em seu lançamento. O equilíbrio entre os poderosos recursos de personalização e a usabilidade é evidente.

Além de comandos de texto, a Sora oferece a possibilidade de importar mídias de referência e criar estilos visuais personalizados. Sua interface inicial lembra o Google Drive, com diretórios de projetos à esquerda e uma área de trabalho à direita. Também traz um feed com criações recentes da comunidade Sora, exibidas como um mural de inspiração visual.

“Nosso objetivo era oferecer mais do que um feed social, mas também uma ferramenta educativa para ajudar os usuários a explorar o potencial da Sora de forma eficaz”, explica Souki Mansoor, líder do programa artístico da plataforma.

Ao clicar em um vídeo no feed, os usuários não só podem assisti-lo, como também conferir os comandos e métodos usados para produzi-lo, podendo, inclusive, fazer alterações e remixar o conteúdo – como uma espécie de “TikTok da IA”.

O conjunto de ferramentas disponíveis se assemelha às de softwares como Adobe Premiere e iMovie. Assim que inicia a geração de um vídeo, a plataforma exibe uma linha do tempo com um storyboard, detalhando cada etapa do que está sendo criado.

Crédito: OpenAI

Durante o último ano, a OpenAI conduziu um teste beta fechado, com criativos de várias partes do mundo, para refinar os recursos da Sora. Um dos projetos de destaque foi o clipe da música “My Love”, da banda canadense Shy Kids.

Criado em apenas duas semanas, o vídeo retrata a amizade de dois macacos em uma floresta tropical, culminando em uma triste reviravolta. Todo o trabalho foi feito praticamente apenas com a Sora, com apenas alguns retoques mínimos de edição e correção de cor.

Enquanto trabalhava com criativos, a OpenAI também testava os limites do sistema com uma equipe de “red teamers” para identificar possíveis usos indevidos antes do lançamento oficial.

A segurança da Sora é reforçada por uma “pilha de proteção”, construída com base na experiência da empresa com o ChatGPT e o Dall-E. Todas as solicitações são monitoradas para evitar a criação de conteúdos violentos ou impróprios.

“Nossa prioridade é equilibrar a criatividade com a segurança”, explica Sahai. “Adotamos uma abordagem extremamente cautelosa para impedir violações, como revenge porn [pornografia de vingança] e abuso infantil. Sabemos que, no início, algumas pessoas acharão as restrições rigorosas demais, mas vamos ajustá-las ao longo do tempo.”

Crédito: Minne Atairu/ OpenAI

Outras medidas incluem o bloqueio automático do uso de rostos de celebridades e figuras públicas, supervisão humana e marcas d’água invisíveis em todos os vídeos para garantir rastreabilidade.

Além disso, usos abusivos e violações de direitos autorais resultarão em banimento. “Estamos tratando isso como um experimento”, enfatiza Sahai. “O acesso está limitado a um grupo pequeno para monitorarmos os resultados de perto.”

Pessoalmente, fico menos preocupado com a possibilidade de revenge porn – que pode ser mitigada com medidas de segurança suficientes – e mais com a falta de consentimento das pessoas para ter suas imagens usadas por qualquer um. Acredito que uma abordagem mais responsável seria oferecer opções rígidas de aceitação (opt-in) ou recusa (opt-out).

Com o opt-in, os artistas só poderiam gerar vídeos deles mesmos, por exemplo. Ou a pessoa poderia simplesmente acessar a OpenAI e solicitar que sua imagem não fosse usada (opt-out). Mas essa possibilidade traria algumas complicações, pois exigiria que a empresa analisasse as imagens de cada rosto inseridas no sistema.

O fato é que Sora já está disponível. A realidade se foi – para sempre.

SOBRE O AUTOR

Mark Wilson é redator sênior da Fast Company. Escreve sobre design, tecnologia e cultura há quase 15 anos. saiba mais