AI BENCHY Compare
xAI: Grok 4.20 vs xAI: Grok 4.3
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-01
| मेट्रिक | Grok 4.20 Grok 4.20 medium | Grok 4.3 Grok 4.3 medium |
|---|---|---|
| स्कोअर | 7.0 | 8.2 |
| क्रमांक | #63 | #20 |
| विश्वसनीयता | लागू नाही | 10.0 |
| सुसंगतता | 7.8 | 8.6 |
| बरोबर चाचण्या | ||
| प्रति प्रयत्न पास दर | 66.7% | 81.5% |
| अस्थिर चाचण्या | 5 | 3 |
| एकूण रन | 54 | 54 |
| प्रति निकाल खर्च | 8.252 | 3.974 |
| एकूण खर्च | $0.743 | $0.517 |
| ???? ??? | $2.000 / 1M | $1.250 / 1M |
| ????? ??? | $6.000 / 1M | $2.500 / 1M |
| आउटपुट टोकन्स | 1,744 | 1,223 |
| रिझनिंग टोकन्स | 109,882 | 187,047 |
| प्रतिसाद वेळ (सरासरी) | 10.33s | 48.63s |
| प्रतिसाद वेळ (कमाल) | 29.87s | 216.69s |
| प्रतिसाद वेळ (एकूण) | 185.87s | 875.27s |
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
श्रेणीवार तपशील
झटपट तुलना
तुलना जोडी बदला
DeepSeek V4 ProhighvsGrok 4.20mediumGemma 4 31Bnoneमोफत उपलब्धvsGrok 4.20mediumHY3 Previewlowमोफत उपलब्धvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumGPT-5.5nonevsGrok 4.20mediumGPT-5.2 ChatnonevsGrok 4.3mediumGrok 4.20mediumvsGLM 5noneGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumHY3 Previewhighमोफत उपलब्धvsGrok 4.3medium