Google Lança Gemini 3.1 Flash-Lite: O Modelo de IA Mais Econômico da Série 3
Google Lança Gemini 3.1 Flash-Lite: O Modelo de IA Mais Econômico da Série 3

A Google anunciou hoje o lançamento do Gemini 3.1 Flash-Lite, o modelo mais rápido e econômico da série Gemini 3. Projetado para workloads de alto volume, o novo modelo delivers inteligência de alto nível a uma fração do custo de modelos maiores.
Contexto
A série Gemini Flash tem sido extremamente popular entre desenvolvedores desde seu lançamento, com modelos como Gemini 2 e 2.5 Flash processando trilhões de tokens em centenas de milhares de aplicações construídas por milhões de desenvolvedores. O novo 3.1 Flash-Lite continua essa tradição, oferecendo um equilíbrio excepcional entre performance, velocidade e custo.
Detalhes do Lançamento
Preço e Disponibilidade
O Gemini 3.1 Flash-Lite está disponível em preview para desenvolvedores através da Gemini API no Google AI Studio e para empresas via Vertex AI, com preços altamente competitivos:
- Entrada: $0,25 por 1M de tokens
- Saída: $1,50 por 1M de tokens
Performance e Benchmarks
Apesar do preço reduzido, o 3.1 Flash-Lite oferece performance impressionante:
- Elo Score de 1432 no Arena.ai Leaderboard
- 86,9% no GPQA Diamond (benchmark de PhD-level reasoning)
- 76,8% no MMMU Pro (multimodal understanding)
- 2,5x mais rápido no Time to First Answer Token comparado ao 2.5 Flash
- 45% mais rápido na velocidade de saída
O modelo supera o Gemini 2.5 Flash em qualidade mantendo custos significativamente menores, estabelecendo um novo padrão na relação custo-benefício para modelos de linguagem.
Recursos Principais
O 3.1 Flash-Lite vem com níveis de pensamento (thinking levels) integrados, permitindo que desenvolvedores controlem quanto o modelo “pensa” para uma tarefa específica. Isso é crucial para gerenciar workloads de alta frequência.
Casos de uso ideais:
- Tradução em alto volume
- Moderação de conteúdo
- Geração de interfaces de usuário
- Criação de simulações
- Seguimento de instruções complexas
Empresas Já Adoptando
Empresas como Latitude, Cartwheel e Whering já estão usando o 3.1 Flash-Lite para resolver problemas complexos em escala. Testadores iniciais destacaram a eficiência do modelo e suas capacidades de raciocínio, observando que ele consegue lidar com entradas complexas com a precisão de modelos de categoria superior.
Evolução da Série Flash
A série Flash continua sendo a versão mais popular da Gemini. O Gemini 3 Flash (lançado em dezembro de 2025) já oferecia inteligência frontier com velocidade Flash-level, e o 3.1 Flash-Lite representa o ápice da eficiência custo-benefício da série.
A série completa agora inclui:
- Gemini 3 Pro – Para tarefas mais complexas
- Gemini 3 Flash – Fronteir intelligence built for speed
- Gemini 3.1 Flash-Lite – Máxima eficiência para alto volume