IA generativa deveria incentivar a criatividade, mas entrega simplificação
Diante de um bufê de palavras, imagens e sons à vontade, provamos tudo, mas não saboreamos nada
Nos primórdios da IA generativa, há menos de dois anos, visitávamos o ChatGPT para nos maravilhar com tudo o que podíamos criar: haikais bobos, poesia e cenas de "Seinfeld". A IA generativa prometia produção ilimitada, e nós a usávamos para criar mais mídia, sem questionar muito. Em um piscar de olhos, as coisas passavam a existir.
Mas a diversão logo acabou, e uma nova funcionalidade devastadora assumiu o controle: usar a IA generativa para comprimir todos os materiais existentes e reapresentá-los de forma simplificada. Não vivemos em uma nova era criativa. Vivemos na era dos resumos.
É fácil olhar para esse avanço com ceticismo: isso é o que obtemos das ferramentas de IA que (ainda) não atingiram seu potencial criativo. Mas talvez essas ferramentas estejam simplesmente respondendo ao desejo humano.
Quanto mais criamos digitalmente, mais rápido queremos digerir todo esse conteúdo. E isso começou muito antes de alguém ter ouvido falar em grandes modelos de linguagem (LLMs, na sigla em inglês).
Começou com os blogueiros que mastigavam longos artigos de jornal até transformá-los em uma polpa suculenta e serviam aos leitores apenas as partes mais palatáveis ou mais picantes. Em pouco tempo, a internet em geral também se tornou mais rápida e mais fácil de ler.
O YouTube adicionou capítulos e resumos a vídeos longos, e as pesquisas do Google agora levam você diretamente à parte relevante de um vídeo.
Conforme os podcasts ganharam popularidade, o mesmo aconteceu com os controles de reprodução: agora, eles permitem ouvir em velocidades de 1,2x, 1,5x ou até 3,5x. No Spotify, as gravadoras lançam músicas pop junto com suas versões aceleradas, perfeitas para serem divulgadas nas mídias sociais onde a atenção é reduzida.
No TikTok, alguns criadores foram além: você pode assistir a recapitulações de filmes de cinema inteiros em um punhado de clipes de dois minutos. A publicação ideal no LinkedIn? Um texto curto, resumido.
Ao tentar forçar nossos cérebros a competir com a capacidade infinita da máquina, apenas nos movemos cada vez mais rápido.
As ferramentas digitais agilizaram a produção de mídia, e a internet agilizou a distribuição. Mas, em vez de nos envolvermos com os artigos, vídeos e podcasts, simplesmente devoramos o “conteúdo”. Diante de um bufê de palavras, imagens e sons, provamos tudo, mas não saboreamos nada.
Os LLMs automatizaram esse fenômeno e estão resumindo praticamente todos os aspectos da vida de forma mais rápida, mais acessível e, em alguns casos, melhor do que os humanos. O Zoom resume suas reuniões, a Microsoft resume suas planilhas e documentos, e a Apple em breve fará o mesmo com seus e-mails e anotações.
A Adobe pode resumir qualquer PDF e reestruturar qualquer dado em um gráfico, enquanto o Canva reduz seu interminável documento de branding em slides concisos. A Amazon condensa milhares de avaliações de produtos em alguns prós e contras.
Google, Bing, Anthropic e Perplexity resumem informações de sites, interceptando leitores em potencial. O LinkedIn oferece um botão para resumir qualquer artigo em seu feed – assim, você nem precisa ler a publicação de outra pessoa com seu resumo.
De certa forma, o resumo traz uma eficiência necessária: ele evita que nos afoguemos em nosso oceano de conteúdo, uma maré cheia que nunca para de subir. Mas, quando você emprega a IA como um algoritmo de compressão em massa para a cultura, alguma coisa fatalmente se perde nessa compactação.
Quando os CDs chegaram, foram anunciados como uma cópia digital perfeita da música. A versão digital, entretanto, era uma interpretação da música feita por engenheiros: os bits de informação que capturavam o timbre único de um vocal ou de uma batida de bateria foram deixados de fora. Frequências complicadas foram resumidas em um código simplificado.
Décadas depois, todos nós reconhecemos que os vinis – ondas sonoras prensadas em plástico, arranhadas por uma agulha – se aproximam muito mais da gravação original. Da mesma forma, a compactação do GPT – e outras tecnologias de compactação – nos rouba a voz, o humor, o raciocínio e as nuances que vêm com o pensamento humano real.
Quanto mais criamos digitalmente, mais rápido queremos digerir todo esse conteúdo.
Não há nada de errado em ganhar tempo e cortar o excesso de conteúdo, especialmente se isso nos tirar um pouco da frente da tela. Mas já lemos os estudos – ou os resumos deles – sobre as propriedades viciantes do contato com o digital. Atualmente, os adolescentes passam até nove horas por dia fixados em pixels.
O objetivo de todas essas eficiências é nos dar mais tempo para acessar ainda mais conteúdo. E, como a mídia que estamos resumindo tende a ser a mais complexa e mais nutritiva, nossos minutos extras são gastos devorando calorias vazias.
Tudo o que sei é que ninguém volta a ouvir o podcast na velocidade de 1x. Ao tentar forçar nossos cérebros a competir com a capacidade infinita da máquina, apenas nos movemos cada vez mais rápido. Lá na frente, vamos nos surpreender com o fato de um dia já termos tido tempo para viver tranquilamente.