नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none प्रकाशन: 2026-03-03 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.8 7.1
क्रमांक #28 #40
सुसंगतता 9.6 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.6% 66.7%
अस्थिर चाचण्या 1 4
एकूण रन 51 51
प्रति निकाल खर्च 0.131 7.358
एकूण खर्च $0.015 $0.663
???? ??? $0.250 / 1M $2.000 / 1M
????? ??? $1.500 / 1M $6.000 / 1M
आउटपुट टोकन्स 4,721 1,494
रिझनिंग टोकन्स 0 97,078
प्रतिसाद वेळ (सरासरी) 1.29s 9.50s
प्रतिसाद वेळ (कमाल) 3.39s 29.87s
प्रतिसाद वेळ (एकूण) 21.95s 161.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 1,092 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 339 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 399 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 568 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 69 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 574 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 972ms 898 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 782 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

झटपट तुलना

तुलना जोडी बदला