नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

xAI: Grok 4.20 vs xAI: Grok 4.3

सारांश

Grok 4.20 vs Grok 4.3 benchmark तुलना: Grok 4.3 average score मध्ये पुढे आहे: 7.7 vs 7.3. Grok 4.20 चा benchmark खर्च कमी आहे: $0.609 vs $0.614. Grok 4.20 वेगवान आहे: 27.68s vs 47.51s, pass rates 63.5% vs 71.4%.

शिफारस केलेले मॉडेल: Grok 4.20 - Its score stays close to the best score here (7.3 vs 7.7), while responding about 1.7x faster than Grok 4.3.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31 Grok 4.3 Grok 4.3 medium प्रकाशन: 2026-05-01
स्कोअर 7.3 7.7
क्रमांक #53 #37
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 63.5% 71.4%
अस्थिर चाचण्या 3 4
एकूण रन 63 63
प्रति निकाल खर्च 8.309 4.724
एकूण खर्च $0.609 $0.614
इनपुट किंमत $1.250 / 1M $1.250 / 1M
आउटपुट किंमत $2.500 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 44,433 44,472
आउटपुट टोकन्स 1,819 1,981
रिझनिंग टोकन्स 219,524 221,382
प्रतिसाद वेळ (सरासरी) 27.68s 47.51s
प्रतिसाद वेळ (कमाल) 199.66s 216.69s
प्रतिसाद वेळ (एकूण) 581.26s 997.68s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 xAI: Grok 4.20

medium
खर्च
$0.041
वेळ
110.3s
टोकन्स
16,336 tok

#37 xAI: Grok 4.3

medium
खर्च
$0.009
वेळ
19.0s
टोकन्स
3,661 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
Grok 4.3 10.0 10.0 100.0% 0 8.83s 2,010 88 8,207
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
Grok 4.3 5.9 7.7 44.4% 1 41.23s 8,340 1,028 31,226
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
Grok 4.3 10.0 10.0 100.0% 0 63.99s 12,909 234 15,301
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
Grok 4.3 10.0 10.0 100.0% 0 18.97s 7,761 180 9,546
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Grok 4.3 5.3 7.2 44.4% 1 181.74s 1,764 14 111,300
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
Grok 4.3 5.4 2.5 66.7% 1 24.70s 825 70 5,020
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
Grok 4.3 9.8 10.0 100.0% 0 18.58s 1,362 57 8,713
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
Grok 4.3 5.9 7.2 55.6% 1 22.52s 1,689 128 14,468
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
Grok 4.3 10.0 10.0 100.0% 0 17.66s 7,263 168 4,615
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442
Grok 4.3 3.0 10.0 0.0% 0 44.47s 549 14 12,986

झटपट तुलना

तुलना जोडी बदला