नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 26B A4B vs Inception: Mercury 2

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-04

मेट्रिक Gemma 4 26B A4B Gemma 4 26B A4B none प्रकाशन: 2026-04-03 Mercury 2 Mercury 2 medium प्रकाशन: 2026-02-24
स्कोअर 6.3 6.3
क्रमांक #53 #52
सुसंगतता 9.1 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 47.1% 51.0%
अस्थिर चाचण्या 2 3
एकूण रन 51 51
प्रति निकाल खर्च 0.068 0.634
एकूण खर्च $0.005 $0.045
???? ??? $0.130 / 1M $0.250 / 1M
????? ??? $0.400 / 1M $0.750 / 1M
आउटपुट टोकन्स 1,335 3,723
रिझनिंग टोकन्स 0 46,120
प्रतिसाद वेळ (सरासरी) 6.56s 2.25s
प्रतिसाद वेळ (कमाल) 57.10s 14.63s
प्रतिसाद वेळ (एकूण) 111.54s 35.99s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 8.3 10.0 75.0% 0 1.28s 230 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 3.0 10.0 0.0% 0 30.53s 309 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 10.0 10.0 100.0% 0 1.70s 285 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 3.6 7.2 22.2% 1 2.49s 27 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 4.0 10.0 0.0% 0 3.54s 85 0
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 4.4 6.9 16.7% 1 1.08s 75 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 5.7 10.0 33.3% 0 739ms 114 0
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 26B A4B 10.0 10.0 100.0% 0 57.10s 210 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

झटपट तुलना

तुलना जोडी बदला