Esta startup está construindo uma IA capaz de ir além do banco de dados
Empresa afirma estar superando os problemas de falsos positivos e “alucinações” que afetam outras ferramentas de IA

A Hebbia, uma startup de IA com sede em Nova York, afirma ter criado uma abordagem que permite à inteligência artificial responder perguntas com base em grandes volumes de dados – sem simplesmente repetir informações ou, pior, inventá-las.
Para que ferramentas de IA generativa consigam ir além dos dados com os quais foram treinadas, muitas empresas têm recorrido à uma técnica chamada geração aumentada por recuperação, ou RAG (sigla em inglês para retrieval-augmented generation).
Nesse modelo, ao receber uma pergunta, a inteligência artificial utiliza um sistema semelhante a um mecanismo de busca para localizar informações relevantes – seja na internet ou em bancos de dados privados.
Essas informações são então combinadas à pergunta e a eventuais instruções adicionais, sendo repassadas ao modelo de linguagem, que as utiliza para formular uma resposta.
O problema é que o RAG tradicional tende a se prender demais a palavras-chave, o que pode desviar o foco da pergunta real. Por exemplo, se um investidor perguntar se determinada empresa parece um bom investimento, o sistema pode retornar trechos de relatórios com declarações otimistas do CEO, em vez de oferecer uma análise criteriosa com base em indicadores relevantes.
“O RAG tradicional funciona bem para responder perguntas cujas respostas estão explícitas nos dados, mas falha quando as perguntas são sobre os dados”, explica George Sivulka, CEO da Hebbia.
Esse tipo de limitação aparece tanto em mecanismos de busca com inteligência artificial de uso geral – que muitas vezes retornam sátiras, informações erradas ou conteúdos fora de contexto – quanto em ferramentas especializadas.
A empresa afirma ter processado 250 milhões de consultas apenas em 2025 – mais do que o dobro do total do ano passado.
Segundo a Hebbia, perguntas que exigem análise aprofundada de grandes volumes de dados geralmente não podem ser respondidas apenas com RAG. Para superar essa limitação, a startup desenvolveu uma técnica chamada decomposição iterativa de fontes.
Em vez de depender de palavras-chave, esse método utiliza um modelo de IA para identificar trechos relevantes em um conjunto de dados ou documentos. Esses trechos são processados por uma rede de modelos interligados, que analisam os dados e os resultados intermediários em conjunto. O resultado é uma resposta mais completa e fundamentada.
“Na prática, o sistema roda um modelo de linguagem sobre cada parte significativa dos dados, alimenta outro modelo com esses resultados, que por sua vez alimenta mais outro, e assim por diante – até chegar a uma resposta final”, explica Sivulka.
Essa estrutura em camadas também ajuda a contornar as limitações das chamadas janelas de contexto, que restringem a quantidade de informação que os modelos conseguem processar de uma vez.
RESPOSTAS PARA PROBLEMAS COMPLEXOS
A startup já conta com clientes como a Força Aérea dos EUA, o escritório de advocacia Gunderson Dettmer e as gestoras de capital privado Charlesbank e Cinven.
Segundo Sivulka, os clientes usam a tecnologia para obter respostas a perguntas complexas sobre dados financeiros em processos de análise de investimentos ou para localizar informações relevantes em grandes volumes de documentos jurídicos.

Em alguns casos, o sistema pode até ser configurado para notificar os usuários quando surgem novos dados que permitem gerar outras conclusões – como no caso de novas divulgações financeiras de uma empresa específica.
Por conta da alta na demanda, a Hebbia – que utiliza modelos de grandes provedores como OpenAI e Anthropic – desenvolveu seu próprio sistema para otimizar o número de consultas enviadas aos diferentes modelos, levando em conta até as variações nas limitações de uso entre as versões acessadas via Microsoft e OpenAI.
A empresa afirma ter processado 250 milhões de consultas apenas este ano – mais do que o dobro do total registrado no ano passado, que foi de 100 milhões.
“Se você é um investidor tentando decidir se deve ou não fazer um aporte, agora pode consultar – e confirmar suas hipóteses com – muito mais dados”, conclui Sivulka.