नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Z.ai: GLM 5

सारांश

GPT-5.4 Mini vs GLM 5 benchmark तुलना: GLM 5 average score में आगे है: 6.0 vs 5.3. GLM 5 की benchmark लागत कम है: $0.027 vs $0.038. GPT-5.4 Mini तेज है: 1.13s vs 4.03s, pass rates 30.2% vs 44.4%.

अनुशंसित मॉडल: GLM 5 - It has the strongest score in this comparison (6.0) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 GLM 5 GLM 5 none रिलीज़: 2026-02-12
स्कोर 5.3 6.0
रैंक #124 #101
विश्वसनीयता 10.0 10.0
संगति 8.8 9.7
सही परीक्षण
प्रति प्रयास पास दर 30.2% 44.4%
अस्थिर टेस्ट 3 1
कुल रन 63 63
प्रति परिणाम लागत 0.743 0.263
कुल लागत $0.038 $0.027
इनपुट कीमत $0.750 / 1M $0.600 / 1M
आउटपुट कीमत $4.500 / 1M $1.920 / 1M
कुल इनपुट टोकन 34,244 37,135
आउटपुट टोकन 2,541 1,989
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.13s 4.03s
प्रतिक्रिया समय (अधिकतम) 2.52s 11.07s
प्रतिक्रिया समय (कुल) 23.82s 56.37s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#124 GPT-5.4 Mini

none
लागत
$0.010
समय
11.7s
टोकन
2,151 tok

#101 GLM 5

none
लागत
$0.007
समय
32.1s
टोकन
2,023 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
GLM 5 4.8 10.0 25.0% 0 2.37s 510 275 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
GLM 5 4.0 7.8 11.1% 1 5.12s 7,256 428 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
GLM 5 3.0 10.0 0.0% 0 4.98s 12,812 406 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
GLM 5 10.0 10.0 100.0% 0 5.78s 7,107 203 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
GLM 5 3.0 10.0 0.0% 0 2.24s 643 19 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
GLM 5 10.0 10.0 100.0% 0 3.27s 477 103 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
GLM 5 10.0 10.0 100.0% 0 1.48s 636 61 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
GLM 5 7.7 10.0 66.7% 0 1.91s 609 261 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
GLM 5 10.0 10.0 100.0% 0 11.07s 6,899 220 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
GLM 5 3.0 10.0 0.0% 0 3.62s 186 13 0

त्वरित तुलना

तुलना जोड़ी बदलें