AI BENCHY
Comparar
❤️ Made by XCS
Your ad here

Nome do modelo

Google: Gemini 3 Flash Preview

Raciocínio (low)

Benchmarks gerados a partir das suítes de teste do AI BENCHY em : 24 de fev. de 2026

Métrica Google: Gemini 3 Flash Preview
Posição#5
EmpresaGoogle
Score 8.23
Consistência 8.71
Custo por resultado 0.6173
Custo total $0.06174
Testes corretos
Taxa de acerto por tentativa 82.0%
Testes instáveis 2
Tokens de saída 936
Tokens de raciocínio 18,071
Tempo de resposta (médio)6746ms
Tempo de resposta (total)87697ms
Tempo de resposta (máx.)14717ms

Detalhamento por categoria

Categoria Testes totalmente aprovados Score Consistência Taxa de acerto por tentativa Testes instáveis Pontuação de raciocínio Tempo de resposta (médio) Custo
Truques anti-IA 10.00 10.00 100.0% 0 6.23 3496ms $0.00844
Análise e extração de dados 10.00 10.00 100.0% 0 4.73 9460ms $0.01354
Específico do domínio 4.00 4.41 55.5% 2 1.83 8314ms $0.01993
Seguimento de instruções 7.50 9.99 50.0% 0 5.00 7016ms $0.00878
Puzzle Solving 10.00 10.00 100.0% 0 7.50 6440ms $0.01105

Modelos comparados

Comparar Google: Gemini 3 Flash Preview com...

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Raciocínio (medium)

Score: 8.54

Consistência: 9.35

Taxa de acerto por tentativa: 87.2%

Testes instáveis: 1

Custo por resultado: 2.1621

Testes corretos:

Custo total: $0.23784

Comparar

#6 · OpenAI

OpenAI: GPT-5.3-Codex

Raciocínio (medium)

Score: 7.77

Consistência: 8.75

Taxa de acerto por tentativa: 76.9%

Testes instáveis: 2

Custo por resultado: 4.9342

Testes corretos:

Custo total: $0.44408

Comparar

#3 · Google

Google: Gemini 3 Pro Preview

Raciocínio (medium)

Score: 8.54

Consistência: 10.00

Taxa de acerto por tentativa: 84.6%

Testes instáveis: 0

Custo por resultado: 0.7901

Testes corretos:

Custo total: $0.08692

Comparar

Comparação rápida

Comparar Google: Gemini 3 Flash Preview com...