नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Z.ai: GLM 5.2

सारांश

gpt-oss-120b vs GLM 5.2 benchmark तुलना: GLM 5.2 average score में आगे है: 7.1 vs 6.7. gpt-oss-120b की benchmark लागत कम है: $0.013 vs $0.076. GLM 5.2 तेज है: 6.34s vs 22.28s, pass rates 52.4% vs 60.3%.

अनुशंसित मॉडल: gpt-oss-120b - Its score stays close to the best score here (6.7 vs 7.1), while costing about 6.2x less than GLM 5.2.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक gpt-oss-120b gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध GLM 5.2 GLM 5.2 none रिलीज़: 2026-06-17
स्कोर 6.7 7.1
रैंक #78 #61
विश्वसनीयता 10.0 9.9
संगति 8.0 9.6
सही परीक्षण
प्रति प्रयास पास दर 52.4% 60.3%
अस्थिर टेस्ट 5 1
कुल रन 63 63
प्रति परिणाम लागत 0.141 0.628
कुल लागत $0.013 $0.076
इनपुट कीमत $0.039 / 1M $1.400 / 1M
आउटपुट कीमत $0.180 / 1M $4.400 / 1M
कुल इनपुट टोकन 39,084 38,671
आउटपुट टोकन 20,013 4,817
रीजनिंग टोकन 50,233 0
प्रतिक्रिया समय (औसत) 22.28s 6.34s
प्रतिक्रिया समय (अधिकतम) 68.16s 20.69s
प्रतिक्रिया समय (कुल) 311.96s 133.19s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 gpt-oss-120b

medium
लागत
$0.001
समय
26.7s
टोकन
555 tok

#61 GLM 5.2

none
अमान्य SVG
लागत
$0.033
समय
87.7s
टोकन
7,455 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
GLM 5.2 8.3 10.0 75.0% 0 3.70s 567 313 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
GLM 5.2 3.7 9.5 0.0% 0 7.55s 7,263 1,958 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
GLM 5.2 10.0 10.0 100.0% 0 20.69s 14,296 1,489 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
GLM 5.2 10.0 10.0 100.0% 0 7.17s 7,113 204 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
GLM 5.2 5.3 10.0 33.3% 0 6.50s 696 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
GLM 5.2 6.1 3.1 66.7% 1 4.42s 480 82 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
GLM 5.2 9.8 10.0 100.0% 0 3.84s 642 66 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
GLM 5.2 7.7 10.0 66.7% 0 3.31s 618 265 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
GLM 5.2 10.0 10.0 100.0% 0 15.76s 6,807 400 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758
GLM 5.2 3.0 10.0 0.0% 0 3.41s 189 13 0

त्वरित तुलना

तुलना जोड़ी बदलें