नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

DeepSeek: DeepSeek V4 Pro vs Z.ai: GLM 5.1

सारांश

DeepSeek V4 Pro vs GLM 5.1 benchmark तुलना: DeepSeek V4 Pro average score में आगे है: 7.2 vs 7.1. DeepSeek V4 Pro की benchmark लागत कम है: $0.034 vs $0.292. DeepSeek V4 Pro तेज है: 6.41s vs 33.67s, pass rates 52.4% vs 68.3%.

अनुशंसित मॉडल: DeepSeek V4 Pro - It has the best score here (7.2), while costing about 8.8x less than GLM 5.1.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक DeepSeek V4 Pro DeepSeek V4 Pro none रिलीज़: 2026-04-24 GLM 5.1 GLM 5.1 medium रिलीज़: 2026-04-07
स्कोर 7.2 7.1
रैंक #58 #64
विश्वसनीयता 9.9 6.7
संगति 8.8 8.3
सही परीक्षण
प्रति प्रयास पास दर 52.4% 68.3%
अस्थिर टेस्ट 3 4
कुल रन 63 63
प्रति परिणाम लागत 0.333 2.496
कुल लागत $0.034 $0.292
इनपुट कीमत $0.435 / 1M $0.980 / 1M
आउटपुट कीमत $0.870 / 1M $3.080 / 1M
कुल इनपुट टोकन 53,558 32,995
आउटपुट टोकन 11,424 11,655
रीजनिंग टोकन 0 75,421
प्रतिक्रिया समय (औसत) 6.41s 33.67s
प्रतिक्रिया समय (अधिकतम) 30.09s 172.60s
प्रतिक्रिया समय (कुल) 134.66s 673.41s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#64 GLM 5.1

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 555 401 5,122
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
GLM 5.1 4.6 3.7 44.5% 2 109.63s 5,702 4,871 37,826
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 17,298 327 4,206
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 7,107 991 4,552
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 489 969 11,314
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 477 2,875 2,875
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 634 204 1,617
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
GLM 5.1 8.2 7.2 88.9% 1 31.64s 609 935 5,730
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0
GLM 5.1 3.0 10.0 0.0% 0 29.40s 124 82 2,179

त्वरित तुलना

तुलना जोड़ी बदलें