AI BENCHY तुलना
xAI: Grok 4.3 vs Z.ai: GLM 5
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01
| मेट्रिक | Grok 4.3 Grok 4.3 medium | GLM 5 GLM 5 medium |
|---|---|---|
| स्कोर | 8.2 | 8.4 |
| रैंक | #20 | #18 |
| विश्वसनीयता | 10.0 | लागू नहीं |
| संगति | 8.6 | 8.2 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 81.5% | 85.2% |
| अस्थिर टेस्ट | 3 | 4 |
| कुल रन | 54 | 54 |
| प्रति परिणाम लागत | 3.974 | 1.188 |
| कुल लागत | $0.517 | $0.155 |
| ???? ??? | $1.250 / 1M | $0.600 / 1M |
| ????? ??? | $2.500 / 1M | $2.080 / 1M |
| आउटपुट टोकन | 1,223 | 20,163 |
| रीजनिंग टोकन | 187,047 | 58,337 |
| प्रतिक्रिया समय (औसत) | 48.63s | 23.34s |
| प्रतिक्रिया समय (अधिकतम) | 216.69s | 79.09s |
| प्रतिक्रिया समय (कुल) | 875.27s | 233.40s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
HY3 Previewlowनिःशुल्क उपलब्धvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumHY3 Previewhighनिःशुल्क उपलब्धvsGLM 5mediumHY3 Previewlowनिःशुल्क उपलब्धvsGLM 5mediumGemini 3 Flash PreviewnonevsGLM 5mediumGemini 3.1 Flash Lite PreviewlowvsGLM 5mediumGPT-5.2 ChatnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumHY3 Previewhighनिःशुल्क उपलब्धvsGrok 4.3mediumDeepSeek V4 FlashhighvsGrok 4.3medium