नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs xAI: Grok 4.1 Fast

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-01

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 Grok 4.1 Fast Grok 4.1 Fast none प्रकाशन: 2025-11-19
स्कोअर 4.8 4.5
क्रमांक #125 #130
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 9.0 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 27.8% 24.1%
अस्थिर चाचण्या 2 3
एकूण रन 54 54
प्रति निकाल खर्च 0.165 0.269
एकूण खर्च $0.007 $0.009
???? ??? $0.250 / 1M $0.200 / 1M
????? ??? $0.750 / 1M $0.500 / 1M
आउटपुट टोकन्स 1,625 1,721
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 613ms 1.76s
प्रतिसाद वेळ (कमाल) 1.27s 5.51s
प्रतिसाद वेळ (एकूण) 11.04s 19.35s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.07s 235 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
Grok 4.1 Fast 5.3 3.4 33.3% 1 1.79s 567 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
Grok 4.1 Fast 3.0 10.0 0.0% 0 3.33s 105 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 943ms 180 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Grok 4.1 Fast 5.9 7.2 55.6% 1 1.06s 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
Grok 4.1 Fast 4.4 9.9 0.0% 0 1.08s 112 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
Grok 4.1 Fast 3.0 10.0 0.0% 0 923ms 56 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.28s 243 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Grok 4.1 Fast 2.8 1.6 33.3% 1 5.51s 208 0

झटपट तुलना

तुलना जोडी बदला