Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Google: Gemma 4 31B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-02

Métrica Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lançamento: 2025-12-17 Gemma 4 31B Gemma 4 31B medium Lançamento: 2026-04-02
Pontuação 10.0 8.6
Posição #1 #5
Consistência 10.0 9.6
Testes corretos
Taxa de acerto por tentativa 100.0% 80.4%
Testes instáveis 0 1
Execuções totais 51 51
Custo por resultado 0.972 0.109
Custo total $0.166 $0.015
Preço de entrada $0.500 / 1M $0.140 / 1M
Preço de saída $3.000 / 1M $0.400 / 1M
Tokens de saída 1,640 9,568
Tokens de raciocínio 48,270 22,501
Tempo de resposta (médio) 11.39s 21.81s
Tempo de resposta (máx.) 50.16s 68.92s
Tempo de resposta (total) 113.86s 327.16s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.13s 305 3,490
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 50.16s 351 12,645
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.72s 279 5,333
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 21.12s 12 14,908
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.09s 111 1,285
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.10s 72 4,558
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.43s 276 4,921
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 10.55s 234 1,130
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0

Comparação rápida

Trocar par de comparação