X da questão: empresas estão treinando seus modelos de IA com os dados errados

Por que a maioria dos investimentos em inteligência artificial fracassa – e como algumas empresas estão saindo na frente

Créditos: gremlin/ Just_Super/ Getty Images

Brian Moore 4 minutos de leitura

As manchetes atuais se dividem entre anúncios de investimentos bilionários em inteligência artificial e histórias de projetos que deram errado. É o mesmo em quase todos os setores: iniciativas promissoras que funcionam perfeitamente em testes, mas falham quando aplicadas no mundo real.

O problema não é falta de poder computacional, de talentos ou de algoritmos avançados. Depois de trabalhar com mais de 250 empresas que implementaram soluções de visão computacional, percebi um padrão claro: as companhias que têm sucesso treinam seus modelos com dados que realmente os colocam à prova, enquanto as que fracassam focam apenas no que funciona em condições ideais.

Quando a Amazon suspendeu o uso da sua tecnologia Just Walk Out – um sistema de varejo automatizado que elimina a necessidade de passar pelo caixa – na maioria dos supermercados dos EUA, em 2024, a mídia destacou os motivos mais óbvios: clientes confusos, tecnologia incipiente e custos trabalhistas que não diminuíram como o esperado.

Mas a verdadeira lição era mais sutil – e muito mais importante. A IA da Amazon conseguia identificar perfeitamente um cliente pegando uma lata de refrigerante em condições ideais: corredores bem iluminados, poucos compradores e produto no lugar certo.

No entanto, o sistema falhava nos cenários caóticos do varejo real: corredores lotados, grupos de pessoas, produtos em prateleiras erradas e estoques que mudam constantemente.

O problema não estava na tecnologia, mas na estratégia de dados. A Amazon havia treinado seus modelos com milhões de horas de vídeo – mas com os vídeos errados. Ela otimizou o sistema para os cenários mais comuns e ignorou a ampla gama de possibilidades e situações que acontecem a todo momento em uma loja.

Essa é a grande falha bilionária: a maioria das empresas está tentando resolver o problema errado.

FOQUE NOS DADOS CERTOS, NÃO EM MAIS DADOS

As empresas que realmente se destacam tratam seus conjuntos de dados com o mesmo rigor que aplicam ao desenvolvimento de seus modelos. Elas buscam identificar as variáveis possíveis e treinar seus sistemas para lidar com situações complexas: um arranhão quase imperceptível em uma peça, uma doença rara em uma imagem médica, uma iluminação atípica em uma linha de produção ou um pedestre andando entre carros estacionados ao anoitecer.

Nesses casos é que os modelos costumam falhar, e é justamente isso que define se um sistema é apenas razoável ou se está realmente preparado para o mundo real.

o sucesso não depende de modelos maiores nem de mais poder computacional, mas de tratar os dados como a base de tudo.

Por isso, a qualidade dos dados está se tornando a maior vantagem competitiva na IA visual. As empresas que já entenderam isso não estão correndo atrás de volume, estão investindo em ferramentas capazes de medir, organizar e melhorar continuamente seus conjuntos de dados.

Como CEO de uma startup de IA visual, aprendi isso da maneira mais difícil. Em 2017, enquanto trabalhava com a prefeitura de Baltimore, nos EUA, na implantação de sistemas de visão para a rede de câmeras de monitoramento de emergências, enfrentamos grandes dificuldades para criar bases de dados, treinar modelos e diagnosticar falhas sem as ferramentas adequadas.

Essa experiência nos levou a desenvolver nossa própria plataforma – que se tornou o FiftyOne, um kit de ferramentas de código aberto para IA visual, hoje com mais de três milhões de instalações. Atualmente, mais de 250 empresas o utilizam para colocar a qualidade dos dados no centro de suas estratégias de inteligência artificial.

trabalho em equipe/ treinamento de dados
Crédito: Freepik

Um bom exemplo é a SafelyYou, empresa que atua em lares de idosos usando um sistema de IA capaz de reduzir em 80% as idas ao pronto-socorro por quedas.

O segredo não está no volume de dados – 60 milhões de minutos de vídeo –, mas na capacidade de identificar variações reais: diferentes condições de iluminação, velocidades, tipos físicos e obstáculos.

Ao automatizar a checagem de erros de anotação e de pontos cegos, a empresa reduziu em 77% a revisão manual, aumentou a precisão em 10% e economizou até 80 horas de trabalho de desenvolvedores por mês.

O QUE VEM ADIANTE

Para os executivos que estão avaliando investimentos em IA visual, a lição é clara: o sucesso não depende de modelos maiores nem de mais poder computacional, mas de tratar os dados como a base de tudo.

Empresas que priorizam a qualidade dos dados superam de forma consistente aquelas que concentram seus esforços apenas em infraestrutura tecnológica ou em contratações. Investir em coleta, curadoria e gestão de dados é o que realmente faz a diferença.

Ao incluir a análise de cenários na estratégia de dados – avaliando como diferentes níveis de qualidade, diversidade e abrangência afetam o desempenho –, as empresas conseguem antecipar riscos, otimizar recursos e tomar decisões mais informadas sobre onde investir.

No fim das contas, os projetos de IA visual mais bem-sucedidos são aqueles que combinam práticas rigorosas de gestão de dados com planejamento estratégico e visão de longo prazo, garantindo que os modelos sejam confiáveis, consistentes e capazes de entregar resultados reais em qualquer contexto.


SOBRE O AUTOR