नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Z.ai: GLM 4.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-16

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 GLM 4.7 Flash GLM 4.7 Flash medium प्रकाशन: 2026-01-19
स्कोअर 4.8 4.6
क्रमांक #89 #91
सुसंगतता 9.0 6.3
बरोबर चाचण्या
प्रति प्रयत्न पास दर 27.8% 38.9%
अस्थिर चाचण्या 2 8
एकूण रन 54 54
प्रति निकाल खर्च 0.165 1.126
एकूण खर्च $0.007 $0.046
???? ??? $0.250 / 1M $0.060 / 1M
????? ??? $0.750 / 1M $0.400 / 1M
आउटपुट टोकन्स 1,625 39,688
रिझनिंग टोकन्स 0 72,401
प्रतिसाद वेळ (सरासरी) 613ms 32.33s
प्रतिसाद वेळ (कमाल) 1.27s 174.55s
प्रतिसाद वेळ (एकूण) 11.04s 355.65s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 1,122 6,110
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
GLM 4.7 Flash 3.6 2.1 33.3% 1 21.26s 969 6,936
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 2,585 20,648
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 584 2,755
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 33,000 25,394
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 18 2,138
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 388 2,181
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.90s 798 5,225
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

झटपट तुलना

तुलना जोडी बदला