नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Z.ai: GLM 5.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-07

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 GLM 5.1 GLM 5.1 none रिलीज़: 2026-04-07
स्कोर 5.6 5.6
रैंक #68 #67
संगति 9.0 8.2
सही परीक्षण
प्रति प्रयास पास दर 39.2% 39.2%
अस्थिर टेस्ट 2 4
कुल रन 51 51
प्रति परिणाम लागत 1.573 1.000
कुल लागत $0.095 $0.050
???? ??? $2.500 / 1M $1.000 / 1M
????? ??? $15.000 / 1M $3.200 / 1M
आउटपुट टोकन 1,837 3,219
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.43s 4.01s
प्रतिक्रिया समय (अधिकतम) 2.89s 32.57s
प्रतिक्रिया समय (कुल) 24.27s 68.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
GLM 5.1 4.0 6.3 25.0% 2 2.11s 305 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
GLM 5.1 2.8 2.1 33.3% 1 32.57s 2,129 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
GLM 5.1 10.0 10.0 100.0% 0 1.08s 204 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
GLM 5.1 2.9 7.2 11.1% 1 1.99s 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
GLM 5.1 5.0 10.0 0.0% 0 790ms 39 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
GLM 5.1 8.3 10.0 50.0% 0 1.58s 66 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
GLM 5.1 5.7 10.0 33.3% 0 1.48s 152 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
GLM 5.1 10.0 10.0 100.0% 0 10.68s 300 0

त्वरित तुलना

तुलना जोड़ी बदलें