नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs xAI: Grok 4.20

सारांश

Gemini 3.5 Flash vs Grok 4.20 benchmark तुलना: Grok 4.20 average score मध्ये पुढे आहे: 7.3 vs 7.0. Grok 4.20 चा benchmark खर्च कमी आहे: $0.609 vs $1.079. Gemini 3.5 Flash वेगवान आहे: 9.93s vs 27.68s, pass rates 77.8% vs 63.5%.

शिफारस केलेले मॉडेल: Grok 4.20 - It has the best score here (7.3), while costing about 1.8x less than Gemini 3.5 Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash none प्रकाशन: 2026-05-19 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.0 7.3
क्रमांक #66 #53
विश्वसनीयता 10.0 10.0
सुसंगतता 8.9 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 77.8% 63.5%
अस्थिर चाचण्या 3 3
एकूण रन 63 63
प्रति निकाल खर्च 7.190 8.309
एकूण खर्च $1.079 $0.609
इनपुट किंमत $1.500 / 1M $1.250 / 1M
आउटपुट किंमत $9.000 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 13,843 44,433
आउटपुट टोकन्स 117,518 1,819
रिझनिंग टोकन्स 0 219,524
प्रतिसाद वेळ (सरासरी) 9.93s 27.68s
प्रतिसाद वेळ (कमाल) 64.36s 199.66s
प्रतिसाद वेळ (एकूण) 178.68s 581.26s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
खर्च
$0.225
वेळ
125.5s
टोकन्स
25,004 tok

#53 xAI: Grok 4.20

medium
खर्च
$0.041
वेळ
110.3s
टोकन्स
16,336 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

झटपट तुलना

तुलना जोडी बदला