नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs Z.ai: GLM 4.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 GLM 4.7 Flash GLM 4.7 Flash medium रिलीज़: 2026-01-19
स्कोर 4.6 4.5
रैंक #153 #155
विश्वसनीयता 10.0 10.0
संगति 9.1 6.7
सही परीक्षण
प्रति प्रयास पास दर 25.0% 35.0%
अस्थिर टेस्ट 2 8
कुल रन 60 60
प्रति परिणाम लागत 0.216 1.337
कुल लागत $0.009 $0.054
इनपुट कीमत $0.250 / 1M $0.060 / 1M
आउटपुट कीमत $0.750 / 1M $0.400 / 1M
कुल इनपुट टोकन 25,515 37,206
आउटपुट टोकन 3,001 43,754
रीजनिंग टोकन 0 89,079
प्रतिक्रिया समय (औसत) 614ms 35.10s
प्रतिक्रिया समय (अधिकतम) 1.27s 174.55s
प्रतिक्रिया समय (कुल) 12.28s 456.24s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
GLM 4.7 Flash 3.4 6.0 16.7% 1 55.33s 3,106 4,981 22,387
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

त्वरित तुलना

तुलना जोड़ी बदलें