नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-08

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none प्रकाशन: 2026-05-08 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 6.7 6.9
क्रमांक #73 #66
विश्वसनीयता 10.0 10.0
सुसंगतता 8.4 8.3
बरोबर चाचण्या
प्रति प्रयत्न पास दर 57.9% 63.2%
अस्थिर चाचण्या 4 4
एकूण रन 57 57
प्रति निकाल खर्च 0.123 7.559
एकूण खर्च $0.012 $0.756
???? ??? $0.250 / 1M $1.250 / 1M
????? ??? $1.500 / 1M $2.500 / 1M
आउटपुट टोकन्स 2,454 1,784
रिझनिंग टोकन्स 0 128,233
प्रतिसाद वेळ (सरासरी) 1.11s 14.53s
प्रतिसाद वेळ (कमाल) 2.97s 63.48s
प्रतिसाद वेळ (एकूण) 21.13s 276.06s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 639 0
Grok 4.20 8.2 7.9 83.3% 1 3.95s 287 8,312
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.59s 636 0
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 357 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 279 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 15 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 63 0
Grok 4.20 3.9 2.6 33.3% 1 24.48s 65 6,440
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 72 0
Grok 4.20 7.3 6.0 83.3% 1 4.42s 40 5,474
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 150 0
Grok 4.20 7.7 10.0 66.7% 0 6.20s 149 7,913
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 234 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 9 0
Grok 4.20 3.0 10.0 0.0% 0 63.48s 9 16,442

झटपट तुलना

तुलना जोडी बदला