AI BENCHY तुलना
Inception: Mercury 2 vs xAI: Grok 4.20
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10
| मेट्रिक | Mercury 2 Mercury 2 medium | Grok 4.20 Grok 4.20 none |
|---|---|---|
| स्कोर | 6.3 | 5.4 |
| रैंक | #82 | #115 |
| विश्वसनीयता | 10.0 | लागू नहीं |
| संगति | 8.7 | 9.5 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 50.9% | 35.2% |
| अस्थिर टेस्ट | 3 | 1 |
| कुल रन | 57 | 54 |
| प्रति परिणाम लागत | 0.616 | 1.574 |
| कुल लागत | $0.050 | $0.095 |
| ???? ??? | $0.250 / 1M | $1.250 / 1M |
| ????? ??? | $0.750 / 1M | $2.500 / 1M |
| आउटपुट टोकन | 3,994 | 1,967 |
| रीजनिंग टोकन | 52,081 | 0 |
| प्रतिक्रिया समय (औसत) | 2.23s | 1.11s |
| प्रतिक्रिया समय (अधिकतम) | 14.63s | 6.04s |
| प्रतिक्रिया समय (कुल) | 40.10s | 20.02s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
Gemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsMiMo-V2-OmninoneGemma 4 26B A4Bnoneनिःशुल्क उपलब्धvsMercury 2mediumElephant AlphamediumvsGrok 4.20noneDeepSeek V4 PrononevsMercury 2mediumMistral Small 4mediumvsGrok 4.20noneMiniMax M2.5mediumनिःशुल्क उपलब्धvsGrok 4.20noneMercury 2mediumvsGLM 5noneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneSeed-2.0-LitenonevsMercury 2mediumMercury 2mediumvsGLM 5V TurbononeMercury 2mediumvsQwen3.5-Flashnone