A nova aposta das pesquisas de opinião: pessoas que não existem
Empresas usam inteligência artificial para gerar respostas simuladas, mas especialistas alertam para riscos de viés e distorção

O setor de pesquisa de mercado enfrenta um problema: você não atende mais o telefone.
Cerca de oito em cada dez pessoas ignoram chamadas de números desconhecidos, segundo o Pew Research Center — uma mudança que afetou diretamente a capacidade de institutos de pesquisa conseguirem respostas do público.
Pesquisas online também têm seus problemas: podem ser manipuladas com facilidade e, como exigem que as pessoas entrem voluntariamente em um site, acabam sendo até mais fáceis de ignorar do que ligações telefônicas.
É aí que a inteligência artificial entra em cena.
Em setores como pesquisas de opinião e pesquisa de mercado, empresas estão usando IA para fabricar respostas sintéticas: criar respostas plausíveis de pessoas falsas para substituir — ou complementar — respostas reais.
A gigante de gestão de experiência Qualtrics agora oferece painéis sintéticos que recebem uma pesquisa como entrada e produzem respostas em nível individual projetadas para se comportar estatisticamente como respostas de mil pessoas reais, segundo Ali Henriques, diretora executiva de pesquisa de mercado da empresa.
O sistema depende fortemente dos próprios dados da Qualtrics: entre 5% e 10% do resultado final vem de modelos públicos disponíveis; os outros mais de 95% são derivados de pesquisas encomendadas pela empresa e dados agregados e anonimizados de clientes, sem identificação de marcas e limitados a informações de até 18 meses ou dois anos para manter relevância.
E não é só a Qualtrics.
Em maio, a Gallup, empresa de pesquisas com 90 anos de história, anunciou parceria com a startup de IA Simile, fundada por pesquisadores de Stanford, para criar “agentes” treinados a partir de entrevistas aprofundadas com cerca de mil integrantes de seu painel probabilístico.
A Gallup, porém, fez questão de deixar limites claros. A empresa afirmou que respostas simuladas não serão usadas para produzir suas estimativas populacionais publicadas e prometeu nunca apresentar respostas artificiais como se fossem humanas.
“Nosso trabalho com respostas simuladas não representa um afastamento desse compromisso”, afirmou a empresa no blog que anunciou a parceria. “Ele é construído sobre essa base.”
Essa cautela é necessária, afirma Jason Miklian, professor pesquisador do Centro para Sustentabilidade Global da Universidade de Oslo, na Noruega, que estuda o espaço de pesquisas sintéticas.
“Embora dados sintéticos possam oferecer uma fotografia incrível das sabedorias convencionais — aquilo que as pessoas geralmente acreditaram ao longo do tempo — eles são incrivelmente ruins para gerar qualquer coisa surpreendente”, diz.
E são justamente as surpresas que importam.
Segundo Miklian, o valor está no conhecimento novo — aquilo que move descobertas acadêmicas ou decisões de negócios.
Ele vê dados sintéticos como úteis para testar questionários antes de gastar dinheiro aplicando-os em pessoas reais ou para perguntas cujas respostas provavelmente seriam iguais às de cinco ou dez anos atrás.
Mas há quem tema um avanço além do razoável.
Sean Westwood, cientista político do Dartmouth College e diretor do laboratório Polarization Research Lab, teme que empresas vendendo amostragens baseadas em silício raramente revelem quais modelos usam ou quais métricas de sucesso deveriam servir de referência.
“‘Usamos GPT-5’ simplesmente não é um método”, afirma.
Para Westwood, “amostragem de silício lava vieses e os transforma em dados”, já que estereótipos absorvidos nos dados de treinamento podem rapidamente virar consenso quando amplificados.
Algumas empresas estão usando IA justamente para aumentar artificialmente suas amostras.
O instituto francês Ifop oferece um produto chamado DataBoost AI, que promete “transformar subamostras pequenas em bases robustas usando alavancas estatísticas”.
Num caso recente criticado por estatísticos franceses na rede Bluesky, o Ifop usou a tecnologia para transformar uma amostra de 116 entrevistas reais com professores do ensino fundamental e médio em um grupo expandido de 580 docentes.
O instituto não respondeu a pedidos de entrevista.
Westwood argumenta que, como modelos de IA funcionam de forma não determinística — introduzindo erros aleatórios a cada execução — pesquisadores não conseguem usar técnicas estatísticas tradicionais para calcular incerteza amostral.
Segundo ele, aumentar amostras artificialmente sacrifica a capacidade de entender o que está sendo medido de fato.
Miklian teme um “efeito de infiltração gradual” das respostas sintéticas em pesquisas políticas antes conduzidas apenas por humanos.
Há ainda o risco de ciclos de retroalimentação: pesquisas sintéticas reforçando pressupostos existentes e depois sendo usadas como munição para contestar resultados eleitorais reais que não correspondam às previsões artificiais.
A Qualtrics tenta evitar esse cenário.
“Estamos fazendo um esforço deliberado para educar o mercado de que isso não é substituição”, afirma Henriques.
Ela passou o último ano e meio pensando em respondentes sintéticos e acredita que existe uma linha clara entre modelar comportamento e reproduzir a vida.
“Todas essas peças começam a se juntar de uma forma realmente interessante, entendendo simplesmente o humano”, diz.
“Mas não acredito que conseguiremos simular completamente essas experiências realmente vividas.”