नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs Z.ai: GLM 5.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-07

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01 GLM 5.1 GLM 5.1 medium रिलीज़: 2026-04-07
स्कोर 6.4 8.0
रैंक #52 #23
संगति 8.5 9.0
सही परीक्षण
प्रति प्रयास पास दर 51.0% 76.5%
अस्थिर टेस्ट 3 2
कुल रन 51 51
प्रति परिणाम लागत 0.220 1.270
कुल लागत $0.016 $0.153
???? ??? $0.260 / 1M $1.000 / 1M
????? ??? $0.380 / 1M $3.200 / 1M
आउटपुट टोकन 7,831 6,666
रीजनिंग टोकन 0 35,313
प्रतिक्रिया समय (औसत) 12.35s 18.23s
प्रतिक्रिया समय (अधिकतम) 115.89s 43.11s
प्रतिक्रिया समय (कुल) 209.94s 291.73s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 401 5,122
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 327 4,206
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 991 4,552
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 969 11,314
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 2,875 2,875
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 204 1,617
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
GLM 5.1 8.2 7.2 88.9% 1 23.85s 899 5,627
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0

त्वरित तुलना

तुलना जोड़ी बदलें