नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-9B vs Z.ai: GLM 5.1

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-07

मेट्रिक Qwen3.5-9B Qwen3.5-9B medium प्रकाशन: 2026-03-02 GLM 5.1 GLM 5.1 none प्रकाशन: 2026-04-07
स्कोअर 4.5 5.6
क्रमांक #87 #67
सुसंगतता 7.0 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 35.3% 39.2%
अस्थिर चाचण्या 6 4
एकूण रन 51 51
प्रति निकाल खर्च 0.787 1.000
एकूण खर्च $0.024 $0.050
???? ??? $0.050 / 1M $1.000 / 1M
????? ??? $0.150 / 1M $3.200 / 1M
आउटपुट टोकन्स 18,141 3,219
रिझनिंग टोकन्स 141,204 0
प्रतिसाद वेळ (सरासरी) 69.21s 4.01s
प्रतिसाद वेळ (कमाल) 226.38s 32.57s
प्रतिसाद वेळ (एकूण) 968.99s 68.23s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
GLM 5.1 4.0 6.3 25.0% 2 2.11s 305 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
GLM 5.1 2.8 2.1 33.3% 1 32.57s 2,129 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
GLM 5.1 10.0 10.0 100.0% 0 1.08s 204 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
GLM 5.1 2.9 7.2 11.1% 1 1.99s 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
GLM 5.1 5.0 10.0 0.0% 0 790ms 39 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
GLM 5.1 8.3 10.0 50.0% 0 1.58s 66 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
GLM 5.1 5.7 10.0 33.3% 0 1.48s 152 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149
GLM 5.1 10.0 10.0 100.0% 0 10.68s 300 0

झटपट तुलना

तुलना जोडी बदला