Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

Modelos comparados

Resumo

Comparação benchmark Gemma 4 31B vs Gemini 3 PRO Preview vs GLM 5 TurboGLM 5 Turbo lidera em Pontuação com 8.4. Gemma 4 31B lidera em Confiabilidade com 10.0. Gemma 4 31B tem o menor Custo total em $0.033. Gemini 3 PRO Preview é o mais rápido com 9.05s.

Modelo recomendado: GLM 5 Turbo - Tem a pontuação mais forte nesta comparação (8.4) e o melhor equilíbrio geral entre custo e tempo de resposta entre os 3 modelos.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-02

Métrica Gemma 4 31B Gemma 4 31B medium Lançamento: 2026-04-02 Disponível grátis Gemini 3 PRO Preview Gemini 3 PRO Preview medium Lançamento: 2025-11-18 GLM 5 Turbo GLM 5 Turbo medium Lançamento: 2026-03-15
Pontuação 6.3 6.2 8.4
Posição #91 #94 #21
Confiabilidade 10.0 N/D 10.0
Consistência 9.4 10.0 8.5
Testes corretos
Taxa de acerto por tentativa 69.8% 66.7% 74.6%
Testes instáveis 1 0 4
Execuções totais 63 63 63
Custo por resultado 0.257 1.406 2.011
Custo total $0.033 $0.385 $0.323
Preço de entrada $0.120 / 1M $9.506 / 1M $1.200 / 1M
Preço de saída $0.350 / 1M $9.506 / 1M $4.000 / 1M
Total de tokens de entrada 17,957 28,848 35,593
Tokens de saída 22,356 1,490 12,245
Tokens de raciocínio 65,726 10,102 62,277
Tempo de resposta (médio) 56.55s 9.05s 23.00s
Tempo de resposta (máx.) 437.40s 26.24s 194.23s
Tempo de resposta (total) 1074.41s 90.53s 482.97s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 Gemma 4 31B

medium
Custo
$0.002
Tempo
45.7s
Tokens
2,696 tok

#94 Gemini 3 PRO Preview

medium
No endpoints found for google/gemini-3-pro-preview.
Custo
$0.000
Tempo
0.1s
Tokens
0 tok

#21 GLM 5 Turbo

medium
Custo
$0.074
Tempo
206.0s
Tokens
18,549 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 14.99s 500 149 1,485
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 555 362 3,137
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 0ms 0 0 0
GLM 5 Turbo 8.2 9.3 66.7% 0 45.90s 5,941 363 25,381
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 10.37s 13,211 351 952
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 12,714 390 2,037
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 10.84s 7,259 279 3,156
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 7,107 577 3,632
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Gemini 3 PRO Preview 5.3 10.0 33.3% 0 7.01s 643 15 1,195
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 489 9,665 19,279
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 9.34s 486 78 374
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 477 60 2,216
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Gemini 3 PRO Preview 9.8 10.0 100.0% 0 3.26s 623 69 754
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 636 255 2,183
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 3.88s 570 225 1,215
GLM 5 Turbo 8.7 7.9 77.8% 1 5.23s 609 312 2,647
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 11.96s 5,556 324 971
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 6,879 241 446
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 0ms 0 0 0
GLM 5 Turbo 3.0 10.0 0.0% 0 40.17s 186 20 1,319

Comparação rápida

Trocar par de comparação