नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Z.ai: GLM 5

सारांश

GPT-5.5 vs GLM 5 benchmark तुलना: GPT-5.5 average score में आगे है: 6.3 vs 6.0. GLM 5 की benchmark लागत कम है: $0.027 vs $0.231. GPT-5.5 तेज है: 1.89s vs 4.03s, pass rates 54.0% vs 44.4%.

अनुशंसित मॉडल: GLM 5 - Its score stays close to the best score here (6.0 vs 6.3), while costing about 8.8x less than GPT-5.5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक GPT-5.5 GPT-5.5 none रिलीज़: 2026-04-24 GLM 5 GLM 5 none रिलीज़: 2026-02-12
स्कोर 6.3 6.0
रैंक #93 #104
विश्वसनीयता 10.0 10.0
संगति 8.8 9.7
सही परीक्षण
प्रति प्रयास पास दर 54.0% 44.4%
अस्थिर टेस्ट 3 1
कुल रन 63 63
प्रति परिणाम लागत 2.302 0.263
कुल लागत $0.231 $0.027
इनपुट कीमत $5.000 / 1M $0.600 / 1M
आउटपुट कीमत $30.000 / 1M $1.920 / 1M
कुल इनपुट टोकन 34,212 37,135
आउटपुट टोकन 1,971 1,989
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.89s 4.03s
प्रतिक्रिया समय (अधिकतम) 5.56s 11.07s
प्रतिक्रिया समय (कुल) 39.64s 56.37s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#93 GPT-5.5

none
लागत
$0.090
समय
54.3s
टोकन
3,063 tok

#104 GLM 5

none
लागत
$0.007
समय
32.1s
टोकन
2,023 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
GLM 5 4.8 10.0 25.0% 0 2.37s 510 275 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
GLM 5 4.0 7.8 11.1% 1 5.12s 7,256 428 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
GLM 5 3.0 10.0 0.0% 0 4.98s 12,812 406 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
GLM 5 10.0 10.0 100.0% 0 5.78s 7,107 203 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
GLM 5 3.0 10.0 0.0% 0 2.24s 643 19 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
GLM 5 10.0 10.0 100.0% 0 3.27s 477 103 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
GLM 5 10.0 10.0 100.0% 0 1.48s 636 61 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
GLM 5 7.7 10.0 66.7% 0 1.91s 609 261 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
GLM 5 10.0 10.0 100.0% 0 11.07s 6,899 220 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0
GLM 5 3.0 10.0 0.0% 0 3.62s 186 13 0

त्वरित तुलना

तुलना जोड़ी बदलें