AI BENCHY Compare
Inception: Mercury 2 vs Elephant
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-14
| Métrica | Mercury 2 Mercury 2 medium | Elephant Elephant none |
|---|---|---|
| Pontuação | 6.5 | 5.2 |
| Posição | #51 | #81 |
| Consistência | 8.6 | 9.6 |
| Testes corretos | ||
| Taxa de acerto por tentativa | 53.7% | 31.5% |
| Testes instáveis | 3 | 1 |
| Execuções totais | 54 | 54 |
| Custo por resultado | 0.580 | 0.000 |
| Custo total | $0.047 | $0.000 |
| Preço de entrada | $0.250 / 1M | $0.000 / 1M |
| Preço de saída | $0.750 / 1M | $0.000 / 1M |
| Tokens de saída | 3,972 | 2,573 |
| Tokens de raciocínio | 48,333 | 0 |
| Tempo de resposta (médio) | 2.21s | 1.23s |
| Tempo de resposta (máx.) | 14.63s | 3.81s |
| Tempo de resposta (total) | 37.51s | 22.16s |
Pontuação vs custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Detalhamento por categoria
Comparação rápida
Trocar par de comparação
Mercury 2mediumvsMiMo-V2-OmninoneMiniMax M2.7mediumvsElephantnoneMercury 2mediumvsGLM 5noneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneMercury 2mediumvsGLM 5V TurbononeMercury 2mediumvsQwen3.5-FlashnoneGemma 4 26B A4BnoneDisponível grátisvsMercury 2mediumSeed-2.0-LitenonevsMercury 2mediumGemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsQwen3.5-35B-A3BnoneDeepSeek V3.2nonevsMercury 2mediumGemma 4 31BnoneDisponível grátisvsMercury 2medium