Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 31B vs Mistral: Mistral Small 4

Resumo

Comparação benchmark Gemma 4 31B vs Mistral Small 4: Gemma 4 31B lidera na pontuação média com 6.3 vs 5.1. Mistral Small 4 tem menor custo de benchmark com $0.007 vs $0.033. Mistral Small 4 é mais rápido com 630ms vs 56.55s, com taxas de acerto de 69.8% vs 27.0%.

Modelo recomendado: Mistral Small 4 - Oferece o melhor compromisso geral: pontuação competitiva (5.1), custo menor que Gemma 4 31B e tempo de resposta equilibrado.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-12

Métrica Gemma 4 31B Gemma 4 31B medium Lançamento: 2026-04-02 Disponível grátis Mistral Small 4 Mistral Small 4 none Lançamento: 2026-03-16
Pontuação 6.3 5.1
Posição #87 #136
Confiabilidade 10.0 10.0
Consistência 9.4 9.5
Testes corretos
Taxa de acerto por tentativa 69.8% 27.0%
Testes instáveis 1 1
Execuções totais 63 63
Custo por resultado 0.257 0.139
Custo total $0.033 $0.007
Preço de entrada $0.120 / 1M $0.150 / 1M
Preço de saída $0.350 / 1M $0.600 / 1M
Total de tokens de entrada 17,957 37,309
Tokens de saída 22,356 2,201
Tokens de raciocínio 65,726 0
Tempo de resposta (médio) 56.55s 630ms
Tempo de resposta (máx.) 437.40s 1.72s
Tempo de resposta (total) 1074.41s 13.22s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#87 Gemma 4 31B

medium
Cost
$0.002
Time
45.7s
Tokens
2,696 tok

#136 Mistral Small 4

none
Cost
$0.002
Time
10.4s
Tokens
2,370 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Mistral Small 4 3.4 7.9 16.7% 1 395ms 708 182 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Mistral Small 4 3.7 9.7 0.0% 0 901ms 7,636 619 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 11,640 496 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Mistral Small 4 10.0 10.0 100.0% 0 822ms 7,914 261 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Mistral Small 4 5.3 10.0 33.3% 0 367ms 798 28 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Mistral Small 4 4.0 10.0 0.0% 0 729ms 519 205 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Mistral Small 4 6.5 10.0 50.0% 0 380ms 729 69 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Mistral Small 4 3.1 9.9 0.0% 0 399ms 735 111 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 6,420 213 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Mistral Small 4 3.0 10.0 0.0% 0 397ms 210 17 0

Comparação rápida

Trocar par de comparação