नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs Grok 4.20 Multi Agent Beta

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B none प्रकाशन: 2026-04-02 Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium प्रकाशन: 2026-03-12
स्कोअर 6.7 6.2
क्रमांक #47 #53
सुसंगतता 10.0 7.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 52.9% 54.9%
अस्थिर चाचण्या 0 6
एकूण रन 51 51
प्रति निकाल खर्च 0.023 82.962
एकूण खर्च $0.002 $4.978
???? ??? $0.140 / 1M $0.000 / 1M
????? ??? $0.400 / 1M $0.000 / 1M
आउटपुट टोकन्स 660 298,948
रिझनिंग टोकन्स 0 296,529
प्रतिसाद वेळ (सरासरी) 2.55s 8.64s
प्रतिसाद वेळ (कमाल) 4.68s 35.28s
प्रतिसाद वेळ (एकूण) 38.20s 129.64s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
Grok 4.20 Multi Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
Grok 4.20 Multi Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
Grok 4.20 Multi Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
Grok 4.20 Multi Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 5.5 10.0 33.3% 0 2.95s 108 0
Grok 4.20 Multi Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0

झटपट तुलना

तुलना जोडी बदला