नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs MoonshotAI: Kimi K2.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B none प्रकाशन: 2026-04-02 Kimi K2.5 Kimi K2.5 medium प्रकाशन: 2026-01-27
स्कोअर 6.7 7.2
क्रमांक #47 #39
सुसंगतता 10.0 7.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 52.9% 72.6%
अस्थिर चाचण्या 0 6
एकूण रन 51 51
प्रति निकाल खर्च 0.023 2.232
एकूण खर्च $0.002 $0.201
???? ??? $0.140 / 1M $0.383 / 1M
????? ??? $0.400 / 1M $1.909 / 1M
आउटपुट टोकन्स 660 40,907
रिझनिंग टोकन्स 0 75,121
प्रतिसाद वेळ (सरासरी) 2.55s 64.59s
प्रतिसाद वेळ (कमाल) 4.68s 137.29s
प्रतिसाद वेळ (एकूण) 38.20s 645.93s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 5.5 10.0 33.3% 0 2.95s 108 0
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812

झटपट तुलना

तुलना जोडी बदला