नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 vs xAI: Grok 4.3

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-01

मेट्रिक Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31 Grok 4.3 Grok 4.3 medium प्रकाशन: 2026-05-01
स्कोअर 7.0 8.2
क्रमांक #63 #20
विश्वसनीयता लागू नाही 10.0
सुसंगतता 7.8 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 81.5%
अस्थिर चाचण्या 5 3
एकूण रन 54 54
प्रति निकाल खर्च 8.252 3.974
एकूण खर्च $0.743 $0.517
???? ??? $2.000 / 1M $1.250 / 1M
????? ??? $6.000 / 1M $2.500 / 1M
आउटपुट टोकन्स 1,744 1,223
रिझनिंग टोकन्स 109,882 187,047
प्रतिसाद वेळ (सरासरी) 10.33s 48.63s
प्रतिसाद वेळ (कमाल) 29.87s 216.69s
प्रतिसाद वेळ (एकूण) 185.87s 875.27s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 7.3 6.0 83.3% 1 4.42s 40 5,474
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615

झटपट तुलना

तुलना जोडी बदला