Navegação
AI BENCHY
Comparar Gráficos
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Inception: Mercury 2

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica Google: Gemini 2.5 Flash none Lançamento: 2025-06-17 Inception: Mercury 2 medium Lançamento: 2026-02-24
Posição #37 #35
Pontuação média 5.2 5.4
Testes corretos
Consistência 9.0 8.3
Custo por resultado 0.185 0.622
Custo total $0.012 $0.044
Taxa de acerto por tentativa 46.7% 57.8%
Testes instáveis 2 3
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Tokens de saída 1,192 3,571
Tokens de raciocínio 0 45,379
Tempo de resposta (médio) 944ms 2.47s
Tempo de resposta (máx.) 4.39s 14.63s
Tempo de resposta (total) 14.16s 34.56s

Melhores modelos por pontuação

Tempo de resposta (médio)

Pontuação vs custo total

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 2.5 Flash 10.0 10.0 0.0% 0 668ms 99 0
Inception: Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 2.5 Flash 10.0 10.0 0.0% 0 4.39s 366 0
Inception: Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 2.5 Flash 9.9 10.0 100.0% 0 652ms 279 0
Inception: Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 2.5 Flash 4.0 7.2 55.6% 1 495ms 12 0
Inception: Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 2.5 Flash 9.0 6.8 66.7% 1 672ms 70 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 2.5 Flash 4.7 10.0 33.3% 0 576ms 132 0
Inception: Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Google: Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

Comparação rápida

Trocar par de comparação