Meta lança sua própria versão de modelos de IA superinteligentes

Muitos na área de IA imaginam esses agentes como assistentes digitais inteligentes o suficiente para realizar muitas tarefas sem intervenção humana

Créditos: АвгустФидлер/ Pixabay/ Meta

Katie Paul 2 minutos de leitura

A Meta – dona do Facebook, do Instagram e do WhatsApp – anunciou o lançamento de uma nova série de modelos de inteligência artificial desenvolvidos por sua divisão de pesquisa, incluindo um "Avaliador Autodidata" que pode abrir caminho para uma menor intervenção humana no processo de desenvolvimento de IA.

O lançamento segue a introdução da ferramenta em um artigo de agosto da Meta, que detalhou como ela se baseia na mesma técnica de "cadeia de pensamento" usada pelos modelos o1 recentemente lançados pela OpenAI. Esse recurso permite que a IA faça julgamentos mais confiáveis sobre as respostas dos modelos de linguagem.

A técnica envolve dividir problemas complexos em etapas lógicas menores e parece melhorar a precisão das respostas em problemas desafiadores em áreas como ciência, programação e matemática.

Os pesquisadores da Meta usaram dados gerados inteiramente por IA para treinar o modelo avaliador, eliminando a necessidade de intervenção humana nessa fase. A capacidade de usar IA para avaliar IA de forma confiável oferece uma visão de um possível caminho para construir agentes autônomos que possam aprender com seus próprios erros, segundo dois dos pesquisadores da Meta responsáveis pelo projeto.

Muitos na área de IA imaginam esses agentes como assistentes digitais inteligentes o suficiente para realizar várias tarefas sem a necessidade de intervenção humana. Modelos autossuficientes poderiam eliminar a necessidade de um processo frequentemente caro e ineficiente usado hoje, chamado "aprendizado por reforço", a partir do Feedback Humano (Reinforcement Learning from Human Feedback), que exige a participação de pessoas com conhecimento especializado para classificar dados com precisão e verificar se as respostas para questões complexas de matemática e redação estão corretas.

A "cadeia de pensamento permite que a IA faça julgamentos mais confiáveis sobre as respostas dos modelos de linguagem.

"Esperamos que, à medida que a IA se torne cada vez mais super-humana, ela se torne cada vez melhor em verificar seu próprio trabalho, de modo que realmente seja melhor que a média humana", diz Jason Weston, um dos pesquisadores. "A ideia de ser autodidata e capaz de se autoavaliar é essencial para alcançar esse tipo de nível super-humano de IA."

Outras empresas, como Google e Anthropic, também publicaram pesquisas sobre o conceito de aprendizado por reforço a partir do feedback de IA. Mas, diferente da Meta, elas tendem a não liberar seus modelos para uso público.

Outras ferramentas de IA recém-lançadas pela Meta incluem uma atualização para o modelo de identificação de imagens Segment Anything, ferramenta que acelera os tempos de geração de respostas de grandes modelos de linguagem (LLMs) e conjuntos de dados que podem ser usados para auxiliar na descoberta de novos materiais inorgânicos.


SOBRE A AUTORA

Katie Paul é repórter da agência Reuters especializada na cobertura de mídias sociais. saiba mais