AI BENCHY Compare
Inception: Mercury 2 vs xAI: Grok 4.20
Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-02
| Metrică | Mercury 2 Mercury 2 medium | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Scor | 6.3 | 5.4 |
| Rang | #51 | #69 |
| Consistență | 8.5 | 9.5 |
| Teste corecte | ||
| Rată de trecere pe încercare | 51.0% | 31.4% |
| Teste instabile | 3 | 1 |
| Rulări totale | 51 | 51 |
| Cost per rezultat | 0.634 | 1.809 |
| Cost total | $0.045 | $0.091 |
| Preț de intrare | $0.250 / 1M | $2.000 / 1M |
| Preț de ieșire | $0.750 / 1M | $6.000 / 1M |
| Tokenuri de ieșire | 3,723 | 1,655 |
| Tokenuri de raționament | 46,120 | 0 |
| Timp de răspuns (mediu) | 2.25s | 1.11s |
| Timp de răspuns (maxim) | 14.63s | 6.04s |
| Timp de răspuns (total) | 35.99s | 18.80s |
Scor vs cost total
Timp de răspuns (mediu)
Scor vs Timp de răspuns (mediu)
Total tokenuri de ieșire
Scor vs Total tokenuri de ieșire
Defalcare pe categorii
Comparație rapidă
Schimbă perechea de comparație
DeepSeek V3.2nonevsMercury 2mediumMercury 2mediumvsMiMo-V2-OmninoneMistral Small 4mediumvsGrok 4.20noneMercury 2mediumvsQwen3.5-FlashnoneMercury 2mediumvsGLM 5V TurbononeSeed-2.0-LitenonevsMercury 2mediumMiniMax M2.7mediumvsGrok 4.20noneGemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsQwen3.5-35B-A3BnoneMercury 2mediumvsGLM 5noneGemma 4 31BnonevsMercury 2mediumMercury 2mediumvsHunter Alphanone