Logo após seu lançamento, DeepSeek reporta ter sofrido um cyberataque

O chatbot “made in China” que abalou os alicerces da indústria de IA teve que limitar o acesso de novos usuários

Créditos: Poetra.RH/ Shutterstock/ Craig Lambert/ Getty Images

Michael Grothaus e Jessica Bursztynsky 5 minutos de leitura

A DeepSeek, empresa chinesa de inteligência artificial cuja tecnologia abalou tanto o Vale do Silício quanto Wall Street, anunciou nesta segunda-feira (dia 27) que vai limitar temporariamente novos registros de usuários devido a "ataques maliciosos em larga escala".

O ataque coincide com o rápido sucesso da empresa. Seu modelo mais recente parece colocá-la ao lado de concorrentes como o ChatGPT da OpenAI e o Gemini do Google, mas, segundo a empresa, a um preço muito mais baixo.

Fundada em 2023, a DeepSeek chegou a fazer o pré-lançamento de seu modelo em novembro de 2024. Mas, neste final de semana, a indústria de inteligência artificial dos EUA foi abalada pelo lançamento da versão atualizada de seu chatbot, o R1 – que parece superar até a versão mais recente do ChatGPT.

A dimensão do choque foi tamanha que o índice Nasdaq (a bolsa na qual são negociadas as ações das empresas de tecnologia) caiu 3,1% nesta segunda-feira. As ações da Nvidia, principal fabricante de chips de IA, caíram 17% – em linha com os 17,4% de queda de outra fabricante de chips, a Broadcom.

Sobrou também para a Microsoft (forte investidora da OpenAI), que viu o preço de suas ações cair 2,1%, e para a Alphabet (holding do Google), cujas ações fecharam o pregão com queda de 4,2%

O principal fator de inquietação é o fato de a DeepSeek ter desenvolvido seu modelo em apenas alguns meses, usando hardware inferior e a um custo que antes parecia inimaginável.

AFINAL, QUEM (OU O QUÊ) É A DEEPSEEK?

A DeepSeek é um laboratório chinês de inteligência artificial sediado na cidade de Hangzhou, na China. A organização lançou um modelo de IA de código aberto também chamado DeepSeek. A versão mais recente, o DeepSeek-V3, concorre diretamente com o ChatGPT da OpenAI (inclusive com as versões mais recentes, o GPT-4o e o1).

Em alguns aspectos, o DeepSeek-V3 consegue superar não só o ChatGPT, mas também o Llama 3.1, da Meta, e o Claude Sonnet 3.5 da Anthropic. E isso nem é o mais impressionante.  O que deixou o setor em choque foi descobrir que a DeepSeek desenvolveu o chatbot em poucos meses, usando hardware que está longe de ser o mais avançado, e com um orçamento minúsculo em comparação com outras empresas que investiram bilhões no desenvolvimento de seus próprios chatbots.

Mesmo tendo que usar hardware menos avançado, a DeepSeek conseguiu criar um modelo LLM superior ao ChatGPT.

Talvez o aspecto mais impressionante da DeepSeek seja o custo de seu desenvolvimento. De acordo com o relatório técnico da empresa sobre o DeepSeek-V3, o custo total para desenvolver o modelo foi de apenas US$ 5,576 milhões. Sim, milhões.

Com menos de US$ 6 milhões, a DeepSeek conseguiu criar um modelo de linguagem (LLM, na sigla em inglês) enquanto outras empresas gastaram bilhões. Para treinar apenas o GPT-4, a OpenAI supostamente gastou US$ 100 milhões em 2023, segundo a revista “Wired”.

Os altos custos de pesquisa e desenvolvimento são a razão pela qual a maioria dos LLMs ainda não deu lucro para as empresas envolvidas. Se as gigantes da inteligência artificial dos EUA pudessem ter desenvolvido esses modelos por apenas alguns milhões de dólares, isso significa que bilhões foram gastos desnecessariamente.

O fato de a DeepSeek ter criado um modelo superior por menos de US$ 6 milhões também levanta sérias preocupações sobre a concorrência. Quando se acreditava que o desenvolvimento de LLMs exigia centenas de milhões (ou bilhões) de dólares, empresas como Meta, Google e OpenAI tinham uma vantagem financeira, já que poucas empresas tinham recursos para competir com os modelos delas.

Agora, se a DeepSeek conseguiu construir seu LLM por apenas US$ 6 milhões, as gigantes da tecnologia dos EUA podem enfrentar muito mais concorrência, não apenas de grandes players, mas também de startups menores de todo o mundo nos próximos meses, visto que o modelo chinês é de código aberto.

QUEM VAI LIDERAR A CORRIDA DA IA?

O governo do presidente Joe Biden impôs uma série de restrições à exportação de tecnologias de IA, entre elas a proibição a empresas norte-americanas de vender seus chips de IA mais avançados e outros hardwares para empresas chinesas. Alguns dos chips mais avançados da Nvidia foram afetados por essas restrições.

Por isso, o sucesso da DeepSeek é ainda mais surpreendente. O modelo foi desenvolvido usando hardware que está longe de ser o mais avançado. A DeepSeek treinou seu LLM usando chips Nvidia H800 – um chip de IA de nível médio.

a DeepSeek desenvolveu o chatbot em poucos meses e com orçamento minúsculo – menos de US$ 6 milhões.

Mesmo tendo que usar hardware menos avançado, a DeepSeek conseguiu criar um modelo LLM superior ao ChatGPT. Além disso, ele é muito mais eficiente em termos de consumo de energia do que modelos como o ChatGPT, o que significa que tem um impacto ambiental menor.

Em entrevista à rede de televisão CNBC, o CEO da Perplexity, Aravind Srinivas, disse sobre as inovações da DeepSeek: "a necessidade é a mãe da invenção. Como eles tiveram que encontrar alternativas, acabaram criando algo muito mais eficiente".

O chatbot pode ser usado gratuitamente – não há custo para usar o DeepSeek-V3, que, em muitos testes, supera o modelo o1 do ChatGPT, que custa US$ 200 por mês. Ele pode ser acessado gratuitamente pela web e tem uma interface semelhante à de outros LLMs.

O DeepSeek-V3 também pode ser usado no celular por meio do aplicativo para iOS e Android. Uma mostra do quão popular a DeepSeek se tornou no mercado de IA nos últimos dias é que o aplicativo já é o mais baixado na App Store.

Com informações da redação da Fast Company Brasil


SOBRE O AUTOR

Michael Grothaus é escritor e colaborador da Fast Company. Jessica Bursztynsky é repórter de tecnologia da Fast Company. saiba mais