नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Z.ai: GLM 5.2

सारांश

gpt-oss-120b vs GLM 5.2 benchmark तुलना: GLM 5.2 average score मध्ये पुढे आहे: 7.1 vs 6.7. gpt-oss-120b चा benchmark खर्च कमी आहे: $0.013 vs $0.076. GLM 5.2 वेगवान आहे: 6.34s vs 22.28s, pass rates 52.4% vs 60.3%.

शिफारस केलेले मॉडेल: gpt-oss-120b - Its score stays close to the best score here (6.7 vs 7.1), while costing about 6.2x less than GLM 5.2.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध GLM 5.2 GLM 5.2 none प्रकाशन: 2026-06-17
स्कोअर 6.7 7.1
क्रमांक #78 #61
विश्वसनीयता 10.0 9.9
सुसंगतता 8.0 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 52.4% 60.3%
अस्थिर चाचण्या 5 1
एकूण रन 63 63
प्रति निकाल खर्च 0.141 0.628
एकूण खर्च $0.013 $0.076
इनपुट किंमत $0.039 / 1M $1.400 / 1M
आउटपुट किंमत $0.180 / 1M $4.400 / 1M
एकूण इनपुट टोकन्स 39,084 38,671
आउटपुट टोकन्स 20,013 4,817
रिझनिंग टोकन्स 50,233 0
प्रतिसाद वेळ (सरासरी) 22.28s 6.34s
प्रतिसाद वेळ (कमाल) 68.16s 20.69s
प्रतिसाद वेळ (एकूण) 311.96s 133.19s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 gpt-oss-120b

medium
खर्च
$0.001
वेळ
26.7s
टोकन्स
555 tok

#61 GLM 5.2

none
अवैध SVG
खर्च
$0.033
वेळ
87.7s
टोकन्स
7,455 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
GLM 5.2 8.3 10.0 75.0% 0 3.70s 567 313 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
GLM 5.2 3.7 9.5 0.0% 0 7.55s 7,263 1,958 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
GLM 5.2 10.0 10.0 100.0% 0 20.69s 14,296 1,489 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
GLM 5.2 10.0 10.0 100.0% 0 7.17s 7,113 204 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
GLM 5.2 5.3 10.0 33.3% 0 6.50s 696 27 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
GLM 5.2 6.1 3.1 66.7% 1 4.42s 480 82 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
GLM 5.2 9.8 10.0 100.0% 0 3.84s 642 66 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
GLM 5.2 7.7 10.0 66.7% 0 3.31s 618 265 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
GLM 5.2 10.0 10.0 100.0% 0 15.76s 6,807 400 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758
GLM 5.2 3.0 10.0 0.0% 0 3.41s 189 13 0

झटपट तुलना

तुलना जोडी बदला