नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs Z.ai: GLM 4.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 GLM 4.7 Flash GLM 4.7 Flash medium रिलीज़: 2026-01-19
स्कोर 4.8 4.6
रैंक #89 #91
संगति 9.0 6.3
सही परीक्षण
प्रति प्रयास पास दर 27.8% 38.9%
अस्थिर टेस्ट 2 8
कुल रन 54 54
प्रति परिणाम लागत 0.165 1.126
कुल लागत $0.007 $0.046
???? ??? $0.250 / 1M $0.060 / 1M
????? ??? $0.750 / 1M $0.400 / 1M
आउटपुट टोकन 1,625 39,688
रीजनिंग टोकन 0 72,401
प्रतिक्रिया समय (औसत) 613ms 32.33s
प्रतिक्रिया समय (अधिकतम) 1.27s 174.55s
प्रतिक्रिया समय (कुल) 11.04s 355.65s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 1,122 6,110
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
GLM 4.7 Flash 3.6 2.1 33.3% 1 21.26s 969 6,936
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 2,585 20,648
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 584 2,755
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 33,000 25,394
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 18 2,138
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 388 2,181
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.90s 798 5,225
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

त्वरित तुलना

तुलना जोड़ी बदलें