Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 26B A4B vs OpenAI: GPT-5.5

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-19

Métrica Gemma 4 26B A4B Gemma 4 26B A4B medium Lançamento: 2026-04-03 Disponível grátis GPT-5.5 GPT-5.5 low Lançamento: 2026-04-24
Pontuação 7.7 8.9
Posição #43 #10
Confiabilidade 10.0 10.0
Consistência 8.7 10.0
Testes corretos
Taxa de acerto por tentativa 73.7% 84.2%
Testes instáveis 3 0
Execuções totais 57 57
Custo por resultado 0.260 4.412
Custo total $0.034 $0.706
Preço de entrada $0.060 / 1M $5.000 / 1M
Preço de saída $0.330 / 1M $30.000 / 1M
Tokens de saída 16,725 2,008
Tokens de raciocínio 61,536 16,914
Tempo de resposta (médio) 33.69s 8.80s
Tempo de resposta (máx.) 180.87s 56.19s
Tempo de resposta (total) 606.35s 167.26s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 1,142 3,045
GPT-5.5 10.0 10.0 100.0% 0 4.43s 246 1,011
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 2.8 10.0 0.0% 0 147.47s 3,516 4,676
GPT-5.5 10.0 10.0 100.0% 0 7.79s 369 936
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 5,415 13,112
GPT-5.5 10.0 10.0 100.0% 0 9.56s 303 717
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 1,567 2,827
GPT-5.5 10.0 10.0 100.0% 0 3.28s 228 157
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 2,469 7,105
GPT-5.5 5.3 10.0 33.3% 0 27.57s 69 11,731
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 25 5,075
GPT-5.5 10.0 10.0 100.0% 0 7.14s 146 170
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 887 4,470
GPT-5.5 9.9 10.0 100.0% 0 2.98s 93 356
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 7.7 7.3 77.8% 1 8.52s 457 3,065
GPT-5.5 10.0 10.0 100.0% 0 4.94s 274 895
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 450 1,256
GPT-5.5 10.0 10.0 100.0% 0 4.96s 250 101
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 797 16,905
GPT-5.5 3.0 10.0 0.0% 0 10.06s 30 840

Comparação rápida

Trocar par de comparação