Os ambiciosos planos da Nvidia para se destacar em inteligência artificial

A gigante dos chips está apostando em uma IA que vai muito além dos chatbots

Crédito: Immo Wegmann/ Unsplash

Victor Dey 4 minutos de leitura

Os avanços recentes em IA generativa têm se concentrado principalmente em linguagem e imagem, com chatbots capazes de escrever poemas e analisar textos, modelos de voz que imitam a fala humana e ferramentas que transformam prompts em obras de arte.

Mas a Nvidia, uma das maiores fabricantes de chips do mundo, está mirando mais alto: sistemas capazes de agir em situações reais e complexas.

Durante a Conferência Internacional sobre Representações de Aprendizagem (ICLR, na sigla em inglês), realizada em Singapura, a empresa apresentou mais de 70 estudos que demonstram avanços em sistemas de IA projetados para realizar tarefas complexas fora do ambiente digital.

No centro dessa evolução estão os modelos fundacionais e os chamados agentes autônomos. A nova pesquisa da Nvidia mostra como a combinação dessas duas tecnologias pode ter efeitos práticos no mundo físico – de robôs adaptativos e design de proteínas até a reconstrução em tempo real de ambientes dinâmicos para veículos autônomos.

Com a IA se tornando cada vez mais presente em diferentes setores, a Nvidia quer se consolidar como a principal fornecedora de infraestrutura dessa nova era. Bryan Catanzaro, vice-presidente de pesquisa em aprendizado profundo da empresa, descreve esse momento como o início de uma inteligência artificial completa, que atua de ponta a ponta.

“Para que a IA seja realmente útil, ela precisa ir além das aplicações tradicionais e lidar com desafios do mundo real. Isso exige sistemas capazes de raciocinar, tomar decisões e interagir com o ambiente para resolver problemas práticos.”

Crédito: Sundry Photography/ Getty Images

Entre os projetos apresentados, quatro modelos se destacaram. Um deles é o Skill Reuse via Skill Adaptation (SRSA), apontado como um dos mais promissores. Esse modelo permite que robôs aprendam a realizar novas tarefas, sem a necessidade de recomeçar o treinamento do zero – um dos grandes obstáculos da robótica.

A maioria dos sistemas robóticos atuais ainda está limitada a funções simples, como transportar objetos. Atividades mais complexas, como montagem de precisão em fábricas, ainda são um grande desafio. O SRSA busca mudar isso utilizando um repertório de habilidades já aprendidas para acelerar a adaptação dos robôs a novas tarefas.

“Quando se deparam com uma tarefa desconhecida, os robôs usam o SRSA para identificar qual habilidade anterior é mais parecida com o novo desafio e, a partir disso, fazem ajustes e aprendem”, explica Catanzaro. “Isso nos aproxima bastante da tão desejada capacidade de generalização, essencial para tornar os robôs mais úteis e flexíveis no mundo real.”

AVANÇOS EM BIOTECNOLOGIA

O setor de biotecnologia tem sido mais lento na adoção da IA, em parte devido à escassez de dados e à complexidade dos algoritmos. Um bom exemplo é o design de proteínas – processo fundamental para o desenvolvimento de medicamentos, mas que muitas vezes esbarra em bases de dados restritas, que dificultam a inovação.

Para resolver isso, a Nvidia desenvolveu o Proteína, um modelo generativo voltado para a criação de novas estruturas de proteínas. Ele é capaz de gerar moléculas maiores, mais variadas e com funções específicas.

Crédito: Freepik

Segundo a empresa, o modelo supera concorrentes como o Genie 2, do Google DeepMind, e o Chroma, da Generate Biomedicines – principalmente na criação de proteínas com cadeias mais complexas.

“O grande diferencial do Proteína é sua capacidade de gerar proteínas com formatos e propriedades específicas, orientadas por rótulos estruturais”, diz Catanzaro. “Isso dá aos cientistas um nível de controle sem precedentes, permitindo desenvolver moléculas totalmente novas, feitas sob medida para usos específicos, como novos medicamentos ou materiais avançados.”

NOVA FERRAMENTA DE IA PARA VEÍCULOS AUTÔNOMOS

Outro destaque é o STORM (Spatio-Temporal Occupancy Reconstruction Machine, ou Máquina de Reconstrução de Ocupação Espaço-Temporal), um modelo capaz de reconstruir ambientes 3D dinâmicos em menos de 200 milissegundos.

Com uma entrada mínima de dados em vídeo, o STORM consegue gerar mapas espaciais altamente detalhados em tempo real – como as ruas em uma cidade ou trilhas na mata –, permitindo que máquinas e sistemas tomem decisões rápidas com base no ambiente à sua volta.

A Nvidia vê o STORM como uma ferramenta essencial para veículos autônomos, drones e tecnologias de realidade aumentada que precisam navegar por ambientes complexos e em constante mudança.

A Nvidia quer se consolidar como a principal fornecedora de infraestrutura da nova era de IA.

Mas o potencial do STORM vai além do setor automotivo. Catanzaro imagina o uso da tecnologia em produtos de consumo, como óculos de realidade aumentada que poderiam mapear, em tempo real, uma partida de futebol ao vivo, proporcionando aos torcedores uma experiência imersiva, como se estivessem em campo.

“A inteligência ambiental em tempo real do STORM nos aproxima de um futuro em que máquinas e dispositivos serão capazes de perceber, compreender e interagir com o mundo físico com a mesma fluidez dos seres humanos”, diz o executivo da Nvidia.

Com os modelos fundacionais e os agentes autônomos ganhando mais capacidade e presença no mundo físico, o futuro da tecnologia vai depender cada vez mais da forma como essas ferramentas interagem com as pessoas. “O mais importante agora é identificar e desenvolver aplicações práticas em diversas áreas”, conclui Catanzaro.


SOBRE O AUTOR

Victor Dey é editor de tecnologia e escreve sobre inteligência artificial, ciência de dados, cibersegurança e metaverso. saiba mais