80% das informações geradas são “invisíveis”. Como fazer para descobri-las?
Se os dados numéricos representam apenas 20% de todas as informações disponíveis, entender e aproveitar os “dados ocultos” pode ser revolucionário
De acordo com a NASA, “matéria” é qualquer substância que possui massa e ocupa lugar no espaço. Mas há muito mais no universo do que a matéria que conseguimos ver. A matéria escura e a energia escura são substâncias misteriosas que influenciam e moldam o cosmos, e os cientistas ainda estão tentando compreendê-las.
Agora, imagine se olhássemos para a enorme quantidade de dados gerados nas últimas duas décadas da mesma maneira. Enquanto a matéria escura representa 85% da matéria do universo, no mundo dos negócios e da análise de dados, apenas cerca de 20% das informações são numéricas e fáceis de analisar por meio de técnicas estatísticas.
Isso significa que os outros 80% são, em grande parte, invisíveis, assim como a matéria escura, influenciando silenciosamente muitos resultados no mundo dos negócios sem serem analisados de forma científica, objetiva ou em larga escala.
Com os avanços da IA generativa, especialmente dos grandes modelos de linguagem (LLMs na sigla em inglês), cientistas agora podem explorar esses dados não estruturados de novas maneiras, abrindo portas para análises modernas e profundas que podem revelar novos significados nas informações disponíveis.
Para líderes, isso representa uma grande transformação e oferece aos pioneiros na adoção da inteligência artificial uma oportunidade única de obter uma vantagem competitiva real.
APROVEITANDO A OPORTUNIDADE DE NEGÓCIOS
Muitas empresas ainda não analisam adequadamente os dados numéricos disponíveis, e estima-se que dados incorretos causem prejuízos de até US$ 3,1 trilhões por ano para a economia dos EUA.
Se os dados numéricos representam apenas 20% de toda a informação disponível, entender e aproveitar os “dados ocultos” em larga escala pode ser revolucionário. Embora a IA generativa possa ajudar a resumir documentos longos, o verdadeiro benefício dos LLMs está em sua capacidade de compreender todas as informações e usá-las para apoiar decisões empresariais.
Pense nos dados de pesquisas com clientes e funcionários, ou nos inúmeros comentários abertos que muitas vezes ficam esquecidos. Há também uma infinidade de informações não estruturadas, como avaliações de produtos, feedback de clientes, perfis de candidatos e currículos, análises financeiras, manuais técnicos, contratos, entre outros.
Agora, esses dados ocultos podem ser quantificados e analisados de maneira contínua e em grande escala, algo que não seria possível com uma análise manual, como é comum atualmente.
Pesquisadores finlandeses recentemente testaram o benefício de usar LLMs na análise de dados qualitativos. Eles dividiram as tarefas de IA em várias etapas, incluindo análise temática, de conteúdo, narrativa e discursiva, além de uma etapa para gerar teorias a partir da análise.
Após aplicarem essa metodologia a diversos conjuntos de dados, os resultados automatizados foram avaliados de forma muito positiva por especialistas. Embora essa abordagem ainda seja nova, há um enorme potencial para os LLMs ajudarem a compreender dados não estruturados.
GERAÇÃO VERSUS INTELIGÊNCIA
A maior parte do setor de tecnologia está focada no aspecto criativo da IA generativa: imagens divertidas, resumos de documentos longos, ideias para festas de aniversário, etc.
No entanto, apesar de todo o hype, o uso corporativo da inteligência artificial é surpreendentemente baixo, e muitas empresas que desenvolvem ferramentas de IA ainda não encontraram formas eficazes de monetizar seus investimentos.
O verdadeiro potencial dos LLMs não está na geração de conteúdo, mas na sua capacidade de entender comandos humanos e executar tarefas. Usando uma abordagem de recuperação generativa aumentada, por exemplo, é possível alimentar o modelo com documentos e fazer perguntas sobre as informações contidas neles ou até mesmo pedir para avaliá-las de uma maneira específica.
Com a inteligência artificial, esses dados ocultos podem ser quantificados e analisados de maneira contínua e em grande escala.
Até agora, a IA e a análise de dados têm funcionado melhor com dados numéricos estruturados. Apesar de existirem técnicas tradicionais para lidar com dados não estruturados, os LLMs têm uma habilidade única de processar e manipular essas informações.
O que os torna tão bons no processamento de texto, em particular, é a sua capacidade sem precedentes de entender e executar comandos. Os usuários podem instruí-los a analisar um conjunto de textos, buscando respostas ou informações específicas, e até pedir que classifiquem os resultados de acordo com uma escala pré-determinada.
Assim, a IA converte dados qualitativos, que não são facilmente analisados estatisticamente, em dados quantitativos úteis, que podem ser combinados com dados numéricos e processados por ferramentas estatísticas comuns.
Os físicos podem ainda estar longe de entender a matéria escura, mas as empresas e os pesquisadores já podem começar a explorar os “dados ocultos” de forma significativa.