Quem treina os grandes modelos de linguagem? Os funcionários da Scale
Empresa trabalha com gigantes como OpenAI e Meta – e desembolsou centenas de milhões de dólares para contratar freelancers no último ano
Para que os grandes modelos de linguagem (LLMs, na sigla em inglês), como o ChatGPT (da OpenAI), o Claude (da Anthropic) e o Gemini (do Google), sejam assistentes eficazes e ótimos parceiros de conversa, eles precisam ser treinados por humanos com muitos exemplos de respostas adequadas.
Empresas de IA geralmente utilizam métodos como o aprendizado por reforço com feedback humano (RLHF), no qual profissionais fornecem exemplos de boas respostas ou avaliam e classificam as respostas geradas pelos sistemas.
Esse nível de treinamento, essencial para chatbots e agentes modernos, requer um enorme esforço, mas os principais laboratórios, como OpenAI e Anthropic, contam com equipes pequenas.
Para suprir a demanda de força de trabalho para treinar IA generativa – especialmente em áreas que exigem especialistas para ensinar habilidades específicas, como resolver problemas complexos de matemática e ciências –, empresas do setor recorrem cada vez mais a parceiros especializados. E a Scale AI é a mais requisitada.
Fundada há cerca de sete anos, a Scale começou focada em tarefas pré-IA generativa, como criar pipelines de dados rotulados para ajudar carros autônomos a identificar pedestres, placas de trânsito e outros elementos comuns nas estradas e vias urbanas.
“Nós nos tornamos referência em algumas técnicas essenciais que desenvolvemos naquela época, e os pipelines que criamos acabaram impulsionando grande parte da revolução atual da IA generativa”, afirma Vijay Karunamurthy, CTO de campo da Scale.
a empresa desenvolveu um conjunto de benchmarks para avaliar os sistemas.
Há cerca de três anos, a empresa começou a trabalhar com a OpenAI no aprimoramento de seus sistemas, usando técnicas de RLHF. Hoje, opera a plataforma de treinamento de IA Outlier, que, segundo Xiaote Zhu, gerente-geral, investiu centenas de milhões de dólares na contratação de dezenas de milhares de freelancers pelo mundo no último ano.
Entre os clientes da Scale estão OpenAI, Microsoft, Meta, Nvidia e Character.ai, além de várias outras empresas e agências governamentais. Seu rápido crescimento fez com que Alexandr Wang, CEO e fundador, se tornasse bilionário aos 27 anos.
“Especialistas são peças-chave nesse tipo de trabalho”, explica Karunamurthy. “Feedback especializado, culturalmente sensível e específico para cada idioma é essencial no ajuste desses modelos.”
ALÉM DO TREINAMENTO
Embora a empresa se dedique a gerenciar colaboradores e encontrar profissionais qualificados para ensinar sistemas de IA até em áreas mais técnicas, ela é muito mais do que apenas uma agência de freelancers.
A Scale trabalha diretamente com empresas de inteligência artificial para testar constantemente as versões mais recentes de seus modelos – que muitas vezes são treinados e ajustados continuamente em supercomputadores que custam bilhões de dólares –, fornecendo análises detalhadas e feedback especializado sobre as mudanças percebidas.
“Cada vez que identificamos que o modelo mudou sua abordagem sobre um tema, investigamos mais a fundo”, diz Karunamurthy. “Queremos saber se a mudança é robusta e duradoura ou apenas algo superficial.”
Os especialistas da Scale também ajudam a garantir que os modelos possam explicar seus próprios processos – um requisito essencial em áreas onde a IA está sujeita a auditorias.
Além disso, a empresa desenvolveu um conjunto de benchmarks para avaliar os sistemas. Embora a metodologia geral seja pública, os detalhes são mantidos em segredo para evitar que desenvolvedores (ou as próprias IAs) “se preparem para os testes”.
LLMs precisam ser treinados por humanos com muitos exemplos de respostas adequadas.
Com a crescente demanda por especialistas – que incluem acadêmicos com doutorado e vencedores de competições internacionais de matemática –, oferecer uma boa remuneração e um ambiente de trabalho atrativo é cada vez mais essencial para recrutar e reter os melhores talentos.
“É como usar cada pedacinho do conhecimento que acumulei ao longo da vida de maneira criativa e produtiva”, diz Gabriela Sanders, uma colaboradora que antes atuava como interventora pedagógica em uma escola.
Hoje, Sanders trabalha exclusivamente treinando modelos de IA, cumprindo uma carga horária de cerca de 40 horas semanais. Ela valoriza a flexibilidade do trabalho e compara o processo a ensinar alunos: encontrar formas eficazes de ajudá-los a entender um determinado conteúdo.