AI BENCHY Compare
Inception: Mercury 2 vs xAI: Grok 4.20
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-02
| Métrica | Mercury 2 Mercury 2 medium | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Pontuação | 6.3 | 5.4 |
| Posição | #51 | #69 |
| Consistência | 8.5 | 9.5 |
| Testes corretos | ||
| Taxa de acerto por tentativa | 51.0% | 31.4% |
| Testes instáveis | 3 | 1 |
| Execuções totais | 51 | 51 |
| Custo por resultado | 0.634 | 1.809 |
| Custo total | $0.045 | $0.091 |
| Preço de entrada | $0.250 / 1M | $2.000 / 1M |
| Preço de saída | $0.750 / 1M | $6.000 / 1M |
| Tokens de saída | 3,723 | 1,655 |
| Tokens de raciocínio | 46,120 | 0 |
| Tempo de resposta (médio) | 2.25s | 1.11s |
| Tempo de resposta (máx.) | 14.63s | 6.04s |
| Tempo de resposta (total) | 35.99s | 18.80s |
Pontuação vs custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Detalhamento por categoria
Comparação rápida
Trocar par de comparação
DeepSeek V3.2nonevsMercury 2mediumMercury 2mediumvsMiMo-V2-OmninoneMistral Small 4mediumvsGrok 4.20noneMercury 2mediumvsQwen3.5-FlashnoneMercury 2mediumvsGLM 5V TurbononeSeed-2.0-LitenonevsMercury 2mediumMiniMax M2.7mediumvsGrok 4.20noneGemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsQwen3.5-35B-A3BnoneMercury 2mediumvsGLM 5noneGemma 4 31BnonevsMercury 2mediumMercury 2mediumvsHunter Alphanone