नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Inception: Mercury 2 vs Z.ai: GLM 5V Turbo

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24 GLM 5V Turbo GLM 5V Turbo none रिलीज़: 2026-04-01
स्कोर 6.3 6.0
रैंक #51 #55
संगति 8.5 10.0
सही परीक्षण
प्रति प्रयास पास दर 51.0% 41.2%
अस्थिर टेस्ट 3 0
कुल रन 51 51
प्रति परिणाम लागत 0.634 0.588
कुल लागत $0.045 $0.042
???? ??? $0.250 / 1M $1.200 / 1M
????? ??? $0.750 / 1M $4.000 / 1M
आउटपुट टोकन 3,723 1,388
रीजनिंग टोकन 46,120 0
प्रतिक्रिया समय (औसत) 2.25s 2.97s
प्रतिक्रिया समय (अधिकतम) 14.63s 6.51s
प्रतिक्रिया समय (कुल) 35.99s 50.57s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
GLM 5V Turbo 4.8 10.0 25.0% 0 3.13s 281 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
GLM 5V Turbo 3.0 10.0 0.0% 0 6.51s 276 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
GLM 5V Turbo 10.0 10.0 100.0% 0 3.81s 204 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
GLM 5V Turbo 5.3 10.0 33.3% 0 2.09s 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
GLM 5V Turbo 4.6 10.0 0.0% 0 2.22s 114 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
GLM 5V Turbo 6.5 10.0 50.0% 0 1.97s 60 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
GLM 5V Turbo 5.3 10.0 33.3% 0 2.22s 207 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
GLM 5V Turbo 10.0 10.0 100.0% 0 4.86s 222 0

त्वरित तुलना

तुलना जोड़ी बदलें