नेविगेशन
AI BENCHY
तुलना करें चार्ट
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

Inception: Mercury 2 vs Z.ai: GLM 4.7 Flash

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक Inception: Mercury 2 medium रिलीज़: 2026-02-24 Z.ai: GLM 4.7 Flash none रिलीज़: 2026-01-19
रैंक #35 #47
औसत स्कोर 5.4 3.9
सही परीक्षण
संगति 8.3 8.3
प्रति परिणाम लागत 0.622 0.064
कुल लागत $0.044 $0.003
प्रति प्रयास पास दर 57.8% 37.8%
अस्थिर टेस्ट 3 3
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन 3,571 1,721
रीजनिंग टोकन 45,379 0
प्रतिक्रिया समय (औसत) 2.47s 3.16s
प्रतिक्रिया समय (अधिकतम) 14.63s 7.05s
प्रतिक्रिया समय (कुल) 34.56s 25.31s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
Z.ai: GLM 4.7 Flash 10.0 7.2 22.2% 1 6.59s 430 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Z.ai: GLM 4.7 Flash 10.0 10.0 0.0% 0 3.22s 704 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
Z.ai: GLM 4.7 Flash 5.4 5.8 83.3% 1 4.82s 196 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Z.ai: GLM 4.7 Flash 7.0 10.0 66.7% 0 744ms 19 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Z.ai: GLM 4.7 Flash 5.5 10.0 50.0% 0 888ms 62 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
Z.ai: GLM 4.7 Flash 3.7 10.0 0.0% 0 1.00s 98 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Z.ai: GLM 4.7 Flash 10.0 1.6 33.3% 1 7.05s 212 0

त्वरित तुलना

तुलना जोड़ी बदलें