AI BENCHY तुलना
OpenAI: GPT-5.4 vs Z.ai: GLM 5.1
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-07
| मेट्रिक | GPT-5.4 GPT-5.4 medium | GLM 5.1 GLM 5.1 medium |
|---|---|---|
| स्कोर | 8.1 | 8.0 |
| रैंक | #19 | #23 |
| संगति | 8.6 | 9.0 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 78.4% | 76.5% |
| अस्थिर टेस्ट | 3 | 2 |
| कुल रन | 51 | 51 |
| प्रति परिणाम लागत | 6.613 | 1.270 |
| कुल लागत | $0.794 | $0.153 |
| ???? ??? | $2.500 / 1M | $1.000 / 1M |
| ????? ??? | $15.000 / 1M | $3.200 / 1M |
| आउटपुट टोकन | 1,780 | 6,666 |
| रीजनिंग टोकन | 46,687 | 35,313 |
| प्रतिक्रिया समय (औसत) | 18.95s | 18.23s |
| प्रतिक्रिया समय (अधिकतम) | 100.41s | 43.11s |
| प्रतिक्रिया समय (कुल) | 322.23s | 291.73s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
Gemini 3 Flash PreviewnonevsGLM 5.1mediumGemini 3.1 Flash Lite PreviewlowvsGLM 5.1mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewnonevsGLM 5.1mediumGPT-5.2 ChatnonevsGLM 5.1mediumGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumGPT-5.3 ChatnonevsGLM 5.1mediumGemini 3 Flash PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewlowvsGLM 5.1mediumClaude Sonnet 4.6nonevsGLM 5.1mediumClaude Sonnet 4.6nonevsGPT-5.4medium