AI BENCHY Compare
Elephant vs xAI: Grok 4.20
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-14
| Métrica | Elephant Elephant none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Pontuação | 5.2 | 5.2 |
| Posição | #81 | #78 |
| Consistência | 9.6 | 9.5 |
| Testes corretos | ||
| Taxa de acerto por tentativa | 31.5% | 29.6% |
| Testes instáveis | 1 | 1 |
| Execuções totais | 54 | 54 |
| Custo por resultado | 0.000 | 1.889 |
| Custo total | $0.000 | $0.095 |
| Preço de entrada | $0.000 / 1M | $2.000 / 1M |
| Preço de saída | $0.000 / 1M | $6.000 / 1M |
| Tokens de saída | 2,573 | 1,967 |
| Tokens de raciocínio | 0 | 0 |
| Tempo de resposta (médio) | 1.23s | 1.11s |
| Tempo de resposta (máx.) | 3.81s | 6.04s |
| Tempo de resposta (total) | 22.16s | 20.02s |
Pontuação vs custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Detalhamento por categoria
Comparação rápida
Trocar par de comparação
ElephantmediumvsGrok 4.20noneMiniMax M2.7mediumvsGrok 4.20noneMiniMax M2.7mediumvsElephantnoneMistral Small 4mediumvsGrok 4.20noneMistral Small 4mediumvsElephantnoneElephantnonevsQwen3 Coder NextmediumMiniMax M2.5mediumDisponível grátisvsGrok 4.20noneQwen3 Coder NextmediumvsGrok 4.20noneMiniMax M2.5mediumDisponível grátisvsElephantnoneElephantnonevsGLM 4.7 FlashmediumGrok 4.20nonevsGLM 4.7 Flashmediumgpt-oss-120bmediumDisponível grátisvsGrok 4.20none