नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs xAI: Grok 4.20

सारांश

Gemini 3.5 Flash vs Grok 4.20 benchmark तुलना: Gemini 3.5 Flash average score मध्ये पुढे आहे: 9.8 vs 7.3. Grok 4.20 चा benchmark खर्च कमी आहे: $0.609 vs $1.115. Gemini 3.5 Flash वेगवान आहे: 8.84s vs 27.68s, pass rates 96.8% vs 63.5%.

शिफारस केलेले मॉडेल: Gemini 3.5 Flash - It has the best score here (9.8), while responding about 3.1x faster than Grok 4.20.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash high प्रकाशन: 2026-05-19 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 9.8 7.3
क्रमांक #1 #53
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 96.8% 63.5%
अस्थिर चाचण्या 1 3
एकूण रन 63 63
प्रति निकाल खर्च 5.575 8.309
एकूण खर्च $1.115 $0.609
इनपुट किंमत $1.500 / 1M $1.250 / 1M
आउटपुट किंमत $9.000 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 37,594 44,433
आउटपुट टोकन्स 1,975 1,819
रिझनिंग टोकन्स 115,638 219,524
प्रतिसाद वेळ (सरासरी) 8.84s 27.68s
प्रतिसाद वेळ (कमाल) 34.82s 199.66s
प्रतिसाद वेळ (एकूण) 185.57s 581.26s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3.5 Flash

high
खर्च
$0.208
वेळ
118.2s
टोकन्स
23,158 tok

#53 xAI: Grok 4.20

medium
खर्च
$0.041
वेळ
110.3s
टोकन्स
16,336 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 492 174 4,997
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.96s 8,118 456 47,129
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 12,873 351 16,323
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 7,548 279 8,466
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 633 12 24,721
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 486 115 1,650
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 615 70 3,799
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 558 241 4,940
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 6,115 265 1,608
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 156 12 2,005
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

झटपट तुलना

तुलना जोडी बदला