नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemma 4 31B vs MoonshotAI: Kimi K2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10

मेट्रिक Gemma 4 31B Gemma 4 31B none रिलीज़: 2026-04-02 निःशुल्क उपलब्ध Kimi K2.5 Kimi K2.5 medium रिलीज़: 2026-01-27
स्कोर 6.9 6.8
रैंक #66 #71
विश्वसनीयता 10.0 10.0
संगति 10.0 7.0
सही परीक्षण
प्रति प्रयास पास दर 52.6% 68.4%
अस्थिर टेस्ट 0 7
कुल रन 57 57
प्रति परिणाम लागत 0.025 2.616
कुल लागत $0.003 $0.236
???? ??? $0.130 / 1M $0.440 / 1M
????? ??? $0.380 / 1M $2.000 / 1M
आउटपुट टोकन 1,371 42,188
रीजनिंग टोकन 0 92,514
प्रतिक्रिया समय (औसत) 3.86s 73.39s
प्रतिक्रिया समय (अधिकतम) 26.13s 150.77s
प्रतिक्रिया समय (कुल) 65.57s 880.65s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 26.13s 699 0
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 33.3% 0 2.95s 108 0
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 1.25s 12 0
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644

त्वरित तुलना

तुलना जोड़ी बदलें