Navegação
AI BENCHY
Comparar Gráficos
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.4

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica Google: Gemini 3.1 Flash Lite Preview low Lançamento: 2026-03-03 OpenAI: GPT-5.4 medium Lançamento: 2026-03-05
Pontuação média 7.6 8.2
Testes corretos
Posição #12 #7
Consistência 10.0 8.9
Custo por resultado 0.170 6.533
Custo total $0.019 $0.784
Taxa de acerto por tentativa 73.3% 86.7%
Testes instáveis 0 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Tokens de saída 1,542 1,611
Tokens de raciocínio 6,888 46,321
Tempo de resposta (médio) 3.49s 21.06s
Tempo de resposta (máx.) 11.91s 100.41s
Tempo de resposta (total) 52.29s 315.95s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 2.18s 456 1,224
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 0.0% 0 11.91s 225 762
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 3.00s 291 696
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 2.36s 18 1,212
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

Comparação rápida

Trocar par de comparação