नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemma 4 26B A4B vs Grok 4.20 Multi Agent Beta

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-04

मेट्रिक Gemma 4 26B A4B Gemma 4 26B A4B none प्रकाशन: 2026-04-03 Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium प्रकाशन: 2026-03-12
स्कोअर 6.3 6.2
क्रमांक #53 #55
सुसंगतता 9.1 7.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 47.1% 54.9%
अस्थिर चाचण्या 2 6
एकूण रन 51 51
प्रति निकाल खर्च 0.068 82.962
एकूण खर्च $0.005 $4.978
???? ??? $0.130 / 1M $0.000 / 1M
????? ??? $0.400 / 1M $0.000 / 1M
आउटपुट टोकन्स 1,335 298,948
रिझनिंग टोकन्स 0 296,529
प्रतिसाद वेळ (सरासरी) 6.56s 8.64s
प्रतिसाद वेळ (कमाल) 57.10s 35.28s
प्रतिसाद वेळ (एकूण) 111.54s 129.64s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 8.3 10.0 75.0% 0 1.28s 230 0
Grok 4.20 Multi Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 3.0 10.0 0.0% 0 30.53s 309 0
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 10.0 10.0 100.0% 0 1.70s 285 0
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 3.6 7.2 22.2% 1 2.49s 27 0
Grok 4.20 Multi Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 4.0 10.0 0.0% 0 3.54s 85 0
Grok 4.20 Multi Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 4.4 6.9 16.7% 1 1.08s 75 0
Grok 4.20 Multi Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 5.7 10.0 33.3% 0 739ms 114 0
Grok 4.20 Multi Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 10.0 10.0 100.0% 0 57.10s 210 0
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0

झटपट तुलना

तुलना जोडी बदला