AI BENCHY तुलना
xAI: Grok 4.20 vs xAI: Grok 4.3
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01
| मेट्रिक | Grok 4.20 Grok 4.20 medium | Grok 4.3 Grok 4.3 medium |
|---|---|---|
| स्कोर | 7.0 | 8.2 |
| रैंक | #63 | #20 |
| विश्वसनीयता | लागू नहीं | 10.0 |
| संगति | 7.8 | 8.6 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 66.7% | 81.5% |
| अस्थिर टेस्ट | 5 | 3 |
| कुल रन | 54 | 54 |
| प्रति परिणाम लागत | 8.252 | 3.974 |
| कुल लागत | $0.743 | $0.517 |
| ???? ??? | $2.000 / 1M | $1.250 / 1M |
| ????? ??? | $6.000 / 1M | $2.500 / 1M |
| आउटपुट टोकन | 1,744 | 1,223 |
| रीजनिंग टोकन | 109,882 | 187,047 |
| प्रतिक्रिया समय (औसत) | 10.33s | 48.63s |
| प्रतिक्रिया समय (अधिकतम) | 29.87s | 216.69s |
| प्रतिक्रिया समय (कुल) | 185.87s | 875.27s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
DeepSeek V4 ProhighvsGrok 4.20mediumGemma 4 31Bnoneनिःशुल्क उपलब्धvsGrok 4.20mediumHY3 Previewlowनिःशुल्क उपलब्धvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumGPT-5.5nonevsGrok 4.20mediumGPT-5.2 ChatnonevsGrok 4.3mediumGrok 4.20mediumvsGLM 5noneGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumHY3 Previewhighनिःशुल्क उपलब्धvsGrok 4.3medium