AI BENCHY Compare
Inception: Mercury 2 vs xAI: Grok 4.20
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-16
| मेट्रिक | Mercury 2 Mercury 2 none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| स्कोअर | 4.8 | 5.2 |
| क्रमांक | #89 | #80 |
| सुसंगतता | 9.0 | 9.5 |
| बरोबर चाचण्या | ||
| प्रति प्रयत्न पास दर | 27.8% | 29.6% |
| अस्थिर चाचण्या | 2 | 1 |
| एकूण रन | 54 | 54 |
| प्रति निकाल खर्च | 0.165 | 1.889 |
| एकूण खर्च | $0.007 | $0.095 |
| ???? ??? | $0.250 / 1M | $2.000 / 1M |
| ????? ??? | $0.750 / 1M | $6.000 / 1M |
| आउटपुट टोकन्स | 1,625 | 1,967 |
| रिझनिंग टोकन्स | 0 | 0 |
| प्रतिसाद वेळ (सरासरी) | 613ms | 1.11s |
| प्रतिसाद वेळ (कमाल) | 1.27s | 6.04s |
| प्रतिसाद वेळ (एकूण) | 11.04s | 20.02s |
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
श्रेणीवार तपशील
झटपट तुलना
तुलना जोडी बदला
ElephantmediumvsGrok 4.20noneMiniMax M2.7mediumvsGrok 4.20noneMercury 2nonevsQwen3 Coder NextmediumMercury 2nonevsGLM 4.7 FlashmediumMercury 2nonevsQwen3.5-9BmediumMistral Small 4mediumvsGrok 4.20noneMercury 2nonevsElephantmediumMiniMax M2.5mediumमोफत उपलब्धvsGrok 4.20noneMercury 2nonevsMiniMax M2.7mediumQwen3 Coder NextmediumvsGrok 4.20noneGrok 4.20nonevsGLM 4.7 Flashmediumgpt-oss-120bmediumमोफत उपलब्धvsGrok 4.20none