नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemma 4 31B vs MoonshotAI: Kimi K2.6

सारांश

Gemma 4 31B vs Kimi K2.6 benchmark तुलना: Gemma 4 31B average score में आगे है: 6.3 vs 5.8. Gemma 4 31B की benchmark लागत कम है: $0.033 vs $0.079. Kimi K2.6 तेज है: 13.27s vs 56.55s, pass rates 69.8% vs 36.5%.

अनुशंसित मॉडल: Gemma 4 31B - It has the best score here (6.3), while costing about 2.4x less than Kimi K2.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध Kimi K2.6 Kimi K2.6 none रिलीज़: 2026-04-20 निःशुल्क उपलब्ध
स्कोर 6.3 5.8
रैंक #87 #115
विश्वसनीयता 10.0 10.0
संगति 9.4 9.2
सही परीक्षण
प्रति प्रयास पास दर 69.8% 36.5%
अस्थिर टेस्ट 1 2
कुल रन 63 63
प्रति परिणाम लागत 0.257 1.267
कुल लागत $0.033 $0.079
इनपुट कीमत $0.120 / 1M $0.680 / 1M
आउटपुट कीमत $0.350 / 1M $3.410 / 1M
कुल इनपुट टोकन 17,957 32,916
आउटपुट टोकन 22,356 16,410
रीजनिंग टोकन 65,726 0
प्रतिक्रिया समय (औसत) 56.55s 13.27s
प्रतिक्रिया समय (अधिकतम) 437.40s 238.89s
प्रतिक्रिया समय (कुल) 1074.41s 278.57s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#87 Gemma 4 31B

medium
Cost
$0.002
Time
45.7s
Tokens
2,696 tok

#115 MoonshotAI: Kimi K2.6

none
Cost
$0.020
Time
127.4s
Tokens
4,429 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Kimi K2.6 4.6 10.0 25.0% 0 1.39s 618 471 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Kimi K2.6 5.5 9.8 33.3% 0 82.57s 5,986 14,754 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Kimi K2.6 3.0 10.0 0.0% 0 3.38s 11,269 290 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Kimi K2.6 10.0 10.0 100.0% 0 1.32s 7,014 201 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Kimi K2.6 5.3 7.2 44.4% 1 1.48s 732 42 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Kimi K2.6 5.4 3.5 33.3% 1 1.55s 477 138 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Kimi K2.6 6.5 10.0 50.0% 0 1.64s 669 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Kimi K2.6 3.1 9.9 0.0% 0 1.40s 651 185 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Kimi K2.6 10.0 10.0 100.0% 0 4.46s 5,286 240 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Kimi K2.6 3.0 10.0 0.0% 0 1.36s 214 17 0

त्वरित तुलना

तुलना जोड़ी बदलें