Depois do DeepSeek, outro grupo chinês lança modelo de IA: o Alibaba

O momento inusitado do lançamento do Qwen 2.5-Max revela a pressão provocada pela ascensão meteórica da DeepSeek

Créditos: Ivana Tomášková/ Pixabay/ Freepik

Eduardo Baptista 3 minutos de leitura

Na quarta-feira (dia 29), a gigante chinesa de tecnologia Alibaba  lançou uma nova versão do seu modelo de inteligência artificial Qwen 2.5, anunciando que ele superou o aclamado DeepSeek-V3.

O lançamento do Qwen 2.5-Max no primeiro dia do Ano Novo Lunar, quando  a maioria dos chinesses está de folga e com suas famílias, revela a pressão que o rápido crescimento da startup chinesa DeepSeek colocou não apenas sobre os concorrentes internacionais, mas também sobre a competição local.

“O Qwen 2.5-Max supera... quase todos os aspectos do GPT-4o, do DeepSeek-V3 e do Llama-3.1-405B”, afirmou a unidade de nuvem da Alibaba em um anúncio postado em sua conta oficial do WeChat, referindo-se aos modelos de IA mais avançados da OpenAI e Meta.

O lançamento do assistente de IA da DeepSeek, impulsionado pelo modelo DeepSeek-V3, no último dia 10 de janeiro, assim como o lançamento do modelo R1 em 20 de janeiro, abalaram o Vale do Silício e causaram uma queda nas ações de empresas de tecnologia.

Os custos de desenvolvimento e uso supostamente baixos da startup chinesa fizeram com que investidores questionassem os planos de grandes gastos das principais empresas de IA dos Estados Unidos.

Mas o sucesso da DeepSeek também fez com que os concorrentes locais corressem atrás do prejuízo para atualizar seus próprios modelos – ou lançar novos, como o modelo de IA da Alibaba.

Dois dias após o lançamento do DeepSeek-R1, a dona do TikTok, a ByteDance, lançou uma atualização de seu principal modelo de IA, afirmando que ele superava o modelo o1 da OpenAI no AIME, um teste de referência que mede como os modelos de IA entendem e respondem a instruções complexas.

Isso reforçou a alegação da DeepSeek de que seu modelo R1 rivalizava com o o1 da OpenAI em vários padrões de referência para desempenho, alegação parecida com a do modelo de IA do Alibaba.

DEEPSEEK X MODELO DE IA DO ALIBABA

O predecessor do modelo DeepSeek-V3, o DeepSeek-V2, desencadeou uma guerra de preços de modelos de IA na China após seu lançamento, em maio do ano passado.

O fato de o DeepSeek-V2 ser de código aberto e incrivelmente barato, custando apenas 1 yuan (US$ 0,14) por milhão de tokens, – ou unidades de dados processadas pelo modelo de IA –, fez com que a unidade de nuvem da Alibaba anunciasse cortes de preços de até 97% em uma série de modelos.

Outras empresas de tecnologia chinesas seguiram o exemplo, incluindo a Baidu, que lançou o primeiro equivalente chinês ao ChatGPT, em março de 2023, e a maior empresa de internet do país, a Tencent.

Em uma rara entrevista à mídia chinesa, em julho, Liang Wenfeng, o enigmático fundador da DeepSeek, disse que a startup “não se importava” com a guerra de preços e que alcançar a IAG (inteligência artificial geral) era seu principal objetivo.

Crédito: Divulgação

A OpenAI define IAG como sistemas autônomos que superam os seres humanos na maioria das tarefas economicamente valiosas.

Enquanto grandes empresas de tecnologia chinesas, como a Alibaba, têm centenas de milhares de funcionários, a DeepSeek funciona como um laboratório de pesquisa, composto principalmente por jovens graduados e estudantes de doutorado das melhores universidades chinesas.

Liang afirmou em sua entrevista de julho que acreditava que as maiores empresas de tecnologia da China talvez não estivessem bem preparadas para o futuro da indústria de IA, comparando seus altos custos e estruturas engessadas com a operação enxuta e o estilo de gestão mais flexível da DeepSeek.

“Modelos fundamentais grandes exigem inovação contínua, e as capacidades dos gigantes tecnológicos têm seus limites”, declarou.


SOBRE O AUTOR

Eduardo Baptista é repórter da agência Reuters. saiba mais