OpenAI lança modelos de IA abertos para enfrentar pressão de laboratórios chineses; entenda

Com a nova estratégia, a empresa pretende disputar espaço com laboratórios chineses

Pessoa mexendo no computador com símbolo da OpenAI
Este é o primeiro modelo aberto lançado pela OpenAI desde o GPT-2, há mais de cinco anos. Crédito: imagem criada com auxílio de IA via ChatGPT.

Guynever Maropo 2 minutos de leitura

A OpenAI anunciou o lançamento de dois modelos de IA abertos com capacidades semelhantes à série O. Os modelos estão disponíveis gratuitamente para download na plataforma Hugging Face, com a empresa destacando seu desempenho em benchmarks de comparação de modelos abertos.

Os modelos chegam em dois tamanhos: o gpt-oss-120b, mais robusto, que funciona em uma GPU Nvidia; e o gpt-oss-20b, mais leve, capaz de rodar em laptops com 16 GB de memória.

Este é o primeiro modelo aberto lançado pela OpenAI desde o GPT-2, há mais de cinco anos. A empresa permitirá que os desenvolvedores conectem esses modelos a soluções mais avançadas na nuvem, caso precisem realizar tarefas mais complexas.

Historicamente, a OpenAI priorizou modelos proprietários e fechados, o que impulsionou seu negócio de APIs para empresas. No entanto, o CEO Sam Altman admitiu que a empresa ficou "do lado errado da história" ao resistir ao código aberto.

A pressão de laboratórios chineses como DeepSeek, Qwen (Alibaba) e Moonshot AI motivou a OpenAI a adotar uma postura mais aberta. O governo Trump também incentivou empresas americanas a liberarem mais tecnologias em código aberto.

Com o lançamento do gpt-oss, a OpenAI busca atrair desenvolvedores e atender às expectativas do governo americano, enquanto enfrenta a concorrência internacional no setor de IA.

Nos testes de desempenho, os modelos gpt-oss-120b e gpt-oss-20b superaram os principais modelos abertos do DeepSeek, mas ficaram abaixo dos modelos o3 e o4-mini da própria empresa. Nos testes de codificação competitiva, as pontuações foram de 2622 e 2516, respectivamente.

Entretanto, as taxas de alucinação continuam altas. Os modelos gpt-oss apresentaram respostas imprecisas em até 53% das perguntas no benchmark interno PersonQA, superando em alucinações os modelos mais avançados da OpenAI.

A empresa explicou que modelos menores, como os de peso aberto, tendem a ter menos conhecimento contextual e, consequentemente, mais alucinações. Apesar disso, a arquitetura MoE (combinação de especialistas) foi utilizada para otimizar a eficiência dos modelos.

Os novos modelos também passaram por treinamento com aprendizado por reforço (RL), semelhante ao processo usado na série O. A diferença é que os modelos abertos são restritos a texto, sem capacidade de processar imagens ou áudio.

A OpenAI lançou os modelos sob a licença Apache 2.0, permitindo uso comercial sem custos adicionais. Contudo, a empresa não divulgará os dados de treinamento, alegando preocupações legais em processos sobre direitos autorais.

Antes do lançamento, a OpenAI realizou testes de segurança para garantir que os modelos não fossem facilmente adaptados para uso em ataques cibernéticos ou criação de armas biológicas. Os testes mostraram riscos marginais, sem evidências de aumento significativo em capacidades perigosas.

Embora a OpenAI tenha dado um passo importante com o gpt-oss, o mercado aguarda os próximos movimentos do DeepSeek R2 e do Superintelligence Lab da Meta, que prometem modelos abertos de nova geração.

Veja também:


SOBRE A AUTORA

Jornalista, pós-graduando em Marketing Digital, com experiência em jornalismo digital e impresso, além de produção e captação de conte... saiba mais