नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Z.ai: GLM 5.1

सारांश

DeepSeek V4 Pro vs GLM 5.1 benchmark तुलना: DeepSeek V4 Pro average score मध्ये पुढे आहे: 7.2 vs 7.1. DeepSeek V4 Pro चा benchmark खर्च कमी आहे: $0.034 vs $0.292. DeepSeek V4 Pro वेगवान आहे: 6.41s vs 33.67s, pass rates 52.4% vs 68.3%.

शिफारस केलेले मॉडेल: DeepSeek V4 Pro - It has the best score here (7.2), while costing about 8.8x less than GLM 5.1.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक DeepSeek V4 Pro DeepSeek V4 Pro none प्रकाशन: 2026-04-24 GLM 5.1 GLM 5.1 medium प्रकाशन: 2026-04-07
स्कोअर 7.2 7.1
क्रमांक #58 #64
विश्वसनीयता 9.9 6.7
सुसंगतता 8.8 8.3
बरोबर चाचण्या
प्रति प्रयत्न पास दर 52.4% 68.3%
अस्थिर चाचण्या 3 4
एकूण रन 63 63
प्रति निकाल खर्च 0.333 2.496
एकूण खर्च $0.034 $0.292
इनपुट किंमत $0.435 / 1M $0.980 / 1M
आउटपुट किंमत $0.870 / 1M $3.080 / 1M
एकूण इनपुट टोकन्स 53,558 32,995
आउटपुट टोकन्स 11,424 11,655
रिझनिंग टोकन्स 0 75,421
प्रतिसाद वेळ (सरासरी) 6.41s 33.67s
प्रतिसाद वेळ (कमाल) 30.09s 172.60s
प्रतिसाद वेळ (एकूण) 134.66s 673.41s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none
अवैध SVG
खर्च
$0.000
वेळ
300.0s
टोकन्स
0 tok

#64 GLM 5.1

medium
अवैध SVG
खर्च
$0.000
वेळ
300.0s
टोकन्स
0 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 555 401 5,122
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
GLM 5.1 4.6 3.7 44.5% 2 109.63s 5,702 4,871 37,826
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 17,298 327 4,206
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 7,107 991 4,552
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 489 969 11,314
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 477 2,875 2,875
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 634 204 1,617
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
GLM 5.1 8.2 7.2 88.9% 1 31.64s 609 935 5,730
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0
GLM 5.1 3.0 10.0 0.0% 0 29.40s 124 82 2,179

झटपट तुलना

तुलना जोडी बदला