18-12-2025 | INTELIGÊNCIA ARTIFICIAL

Gemini Flash: o que é como funciona o novo modelo rápido do Google

O lançamento ocorre após a apresentação do Gemini 3 Pro e do modo Deep Think

O lançamento ocorre após a apresentação do Gemini 3 Pro e do modo Deep Think.Crédito: imagem criada com auxílio de IA via Copilot.

Vitória Tedeschi 2 minutos de leitura

O Gemini Flash passa a integrar a nova geração de modelos de Inteligência Artificial do Google com foco em velocidade, eficiência e uso em larga escala. A proposta é oferecer raciocínio avançado com menor latência e custo reduzido.

Segundo o blog do Google, o modelo amplia o acesso às capacidades do Gemini 3 ao combinar desempenho elevado com respostas mais rápidas. A empresa afirma que a tecnologia foi pensada para aplicações práticas do dia a dia e ambientes corporativos.

O lançamento ocorre após a apresentação do Gemini 3 Pro e do modo Deep Think. Com isso, o Google reorganiza sua oferta de modelos para atender desde tarefas simples até fluxos de trabalho mais complexos.

O que é o Gemini Flash?

O Gemini Flash é um modelo otimizado para velocidade. Ele mantém a base de raciocínio do Gemini 3, mas reduz o tempo de resposta e o consumo de recursos.

A tecnologia permite que o sistema ajuste automaticamente o nível de processamento conforme a complexidade da tarefa. Em atividades comuns, o modelo utiliza menos tokens e entrega respostas mais rápidas.

O que muda em relação às versões anteriores?

Em comparação com o Gemini 2.5 Pro, o Gemini Flash executa tarefas até três vezes mais rápido. O ganho ocorre sem perda relevante de qualidade em raciocínio, multimodalidade e codificação.

O modelo também melhora a renderização visual, a compreensão de contexto e a execução de agentes automatizados, o que amplia o uso em aplicações interativas.

Como funciona o custo do novo modelo?

O Gemini Flash chega com preços reduzidos na API. O valor de entrada é de R$ 2,50 por 1 milhão de tokens, enquanto a saída custa R$ 15,00 por 1 milhão de tokens.

A entrada de áudio mantém o valor de R$ 5,00 por 1 milhão de tokens. A redução de custo posiciona o modelo como alternativa mais acessível para desenvolvedores.

Para quem o Gemini Flash foi pensado?

O modelo atende desenvolvedores que precisam de respostas rápidas em ciclos contínuos, como aplicações interativas, agentes de suporte e sistemas em tempo real.

Empresas também utilizam o Gemini Flash em análise multimodal, extração de dados, geração de código e automação de tarefas complexas, com menor consumo de recursos.

O Gemini Flash já está disponível?

Sim. O modelo já está disponível e passa a ser o modelo padrão no aplicativo Gemini, substituindo versões anteriores. Usuários comuns têm acesso gratuito à nova tecnologia.

Você pode se interessar também:

O Gemini Flash também começa a ser integrada ao Modo IA da Busca, além de estar disponível no Vertex AI, Gemini Enterprise e nas ferramentas de desenvolvimento do Google.

SOBRE A AUTORA

Jornalista pós-graduada em Jornalismo Digital com experiência em produção e revisão de conteúdos estratégicos para plataformas online.... saiba mais