नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-15

मेट्रिक GPT-5.4 GPT-5.4 medium प्रकाशन: 2026-03-05 GLM 5 GLM 5 medium प्रकाशन: 2026-02-12
क्रमांक #9 #13
स्कोअर 8.5 8.2
सुसंगतता 8.5 8.0
प्रति निकाल खर्च 6.601 0.933
एकूण खर्च $0.793 $0.103
बरोबर चाचण्या
प्रति प्रयत्न पास दर 83.3% 83.3%
अस्थिर चाचण्या 3 4
एकूण रन 48 48
आउटपुट टोकन्स 1,756 19,773
रिझनिंग टोकन्स 46,642 36,459
प्रतिसाद वेळ (सरासरी) 20.05s 16.16s
प्रतिसाद वेळ (कमाल) 100.41s 28.96s
प्रतिसाद वेळ (एकूण) 320.87s 129.26s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
GLM 5 10.0 10.0 100.0% 0 22.26s 420 4,992
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
GLM 5 7.1 5.6 83.3% 1 8.90s 567 3,734
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
GLM 5 3.5 4.4 33.3% 2 0ms 13,176 14,137
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
GLM 5 6.1 3.1 66.7% 1 14.69s 2,020 2,248
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
GLM 5 10.0 10.0 100.0% 0 15.93s 233 994

झटपट तुलना

तुलना जोडी बदला