नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Z.ai: GLM 5.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-07

मेट्रिक gpt-oss-120b gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध GLM 5.1 GLM 5.1 none रिलीज़: 2026-04-07
स्कोर 6.0 5.6
रैंक #59 #67
संगति 7.6 8.2
सही परीक्षण
प्रति प्रयास पास दर 51.0% 39.2%
अस्थिर टेस्ट 5 4
कुल रन 51 51
प्रति परिणाम लागत 0.136 1.000
कुल लागत $0.010 $0.050
???? ??? $0.039 / 1M $1.000 / 1M
????? ??? $0.190 / 1M $3.200 / 1M
आउटपुट टोकन 13,265 3,219
रीजनिंग टोकन 34,330 0
प्रतिक्रिया समय (औसत) 15.05s 4.01s
प्रतिक्रिया समय (अधिकतम) 50.92s 32.57s
प्रतिक्रिया समय (कुल) 150.55s 68.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
GLM 5.1 4.0 6.3 25.0% 2 2.11s 305 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
GLM 5.1 2.8 2.1 33.3% 1 32.57s 2,129 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
GLM 5.1 10.0 10.0 100.0% 0 1.08s 204 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
GLM 5.1 2.9 7.2 11.1% 1 1.99s 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
GLM 5.1 5.0 10.0 0.0% 0 790ms 39 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
GLM 5.1 8.3 10.0 50.0% 0 1.58s 66 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
GLM 5.1 5.7 10.0 33.3% 0 1.48s 152 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
GLM 5.1 10.0 10.0 100.0% 0 10.68s 300 0

त्वरित तुलना

तुलना जोड़ी बदलें