Google Lança Gemini 3.1 Flash-Lite: O Modelo de IA Mais Econômico da Série 3

Mar 3, 2026 · 3 min read · google gemini flash-lite ia modelo-de-linguagem ·

Partilhar:

Google Lança Gemini 3.1 Flash-Lite: O Modelo de IA Mais Econômico da Série 3

A Google anunciou hoje o lançamento do Gemini 3.1 Flash-Lite, o modelo mais rápido e econômico da série Gemini 3. Projetado para workloads de alto volume, o novo modelo delivers inteligência de alto nível a uma fração do custo de modelos maiores.

Contexto

A série Gemini Flash tem sido extremamente popular entre desenvolvedores desde seu lançamento, com modelos como Gemini 2 e 2.5 Flash processando trilhões de tokens em centenas de milhares de aplicações construídas por milhões de desenvolvedores. O novo 3.1 Flash-Lite continua essa tradição, oferecendo um equilíbrio excepcional entre performance, velocidade e custo.

Detalhes do Lançamento

Preço e Disponibilidade

O Gemini 3.1 Flash-Lite está disponível em preview para desenvolvedores através da Gemini API no Google AI Studio e para empresas via Vertex AI, com preços altamente competitivos:

Entrada: $0,25 por 1M de tokens
Saída: $1,50 por 1M de tokens

Performance e Benchmarks

Apesar do preço reduzido, o 3.1 Flash-Lite oferece performance impressionante:

Elo Score de 1432 no Arena.ai Leaderboard
86,9% no GPQA Diamond (benchmark de PhD-level reasoning)
76,8% no MMMU Pro (multimodal understanding)
2,5x mais rápido no Time to First Answer Token comparado ao 2.5 Flash
45% mais rápido na velocidade de saída

O modelo supera o Gemini 2.5 Flash em qualidade mantendo custos significativamente menores, estabelecendo um novo padrão na relação custo-benefício para modelos de linguagem.

Recursos Principais

O 3.1 Flash-Lite vem com níveis de pensamento (thinking levels) integrados, permitindo que desenvolvedores controlem quanto o modelo “pensa” para uma tarefa específica. Isso é crucial para gerenciar workloads de alta frequência.

Casos de uso ideais:

Tradução em alto volume
Moderação de conteúdo
Geração de interfaces de usuário
Criação de simulações
Seguimento de instruções complexas

Empresas Já Adoptando

Empresas como Latitude, Cartwheel e Whering já estão usando o 3.1 Flash-Lite para resolver problemas complexos em escala. Testadores iniciais destacaram a eficiência do modelo e suas capacidades de raciocínio, observando que ele consegue lidar com entradas complexas com a precisão de modelos de categoria superior.

Evolução da Série Flash

A série Flash continua sendo a versão mais popular da Gemini. O Gemini 3 Flash (lançado em dezembro de 2025) já oferecia inteligência frontier com velocidade Flash-level, e o 3.1 Flash-Lite representa o ápice da eficiência custo-benefício da série.

A série completa agora inclui:

Gemini 3 Pro – Para tarefas mais complexas
Gemini 3 Flash – Fronteir intelligence built for speed
Gemini 3.1 Flash-Lite – Máxima eficiência para alto volume

Google Lança Gemini 3.1 Flash-Lite: O Modelo de IA Mais Econômico da Série 3

Google Lança Gemini 3.1 Flash-Lite: O Modelo de IA Mais Econômico da Série 3

Contexto

Detalhes do Lançamento

Preço e Disponibilidade

Performance e Benchmarks

Recursos Principais

Empresas Já Adoptando

Evolução da Série Flash

Fontes

Traduções: