नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Z.ai: GLM 5.1

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05 GLM 5.1 GLM 5.1 medium प्रकाशन: 2026-04-07
स्कोअर 7.6 7.8
क्रमांक #49 #44
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 9.1 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.4% 75.9%
अस्थिर चाचण्या 2 3
एकूण रन 54 54
प्रति निकाल खर्च 12.047 1.674
एकूण खर्च $1.446 $0.201
???? ??? $5.000 / 1M $1.050 / 1M
????? ??? $25.000 / 1M $3.500 / 1M
आउटपुट टोकन्स 29,829 8,005
रिझनिंग टोकन्स 18,938 49,090
प्रतिसाद वेळ (सरासरी) 21.08s 24.13s
प्रतिसाद वेळ (कमाल) 83.40s 118.52s
प्रतिसाद वेळ (एकूण) 231.84s 410.25s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
GLM 5.1 10.0 10.0 100.0% 0 8.31s 401 5,122
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
GLM 5.1 4.7 1.6 66.7% 1 118.52s 1,339 13,777
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
GLM 5.1 9.5 10.0 100.0% 0 43.11s 327 4,206
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
GLM 5.1 10.0 10.0 100.0% 0 9.33s 991 4,552
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
GLM 5.1 5.3 10.0 33.3% 0 29.77s 969 11,314
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
GLM 5.1 10.0 10.0 100.0% 0 20.95s 2,875 2,875
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
GLM 5.1 6.4 5.8 66.7% 1 7.47s 204 1,617
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
GLM 5.1 8.2 7.2 88.9% 1 23.85s 899 5,627
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0

झटपट तुलना

तुलना जोडी बदला