नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Mistral: Mistral Small 4 vs MoonshotAI: Kimi K2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Mistral Small 4 Mistral Small 4 none रिलीज़: 2026-03-16 Kimi K2.5 Kimi K2.5 none रिलीज़: 2026-01-27
रैंक #61 #59
स्कोर 5.3 5.3
संगति 9.5 8.7
प्रति परिणाम लागत 0.108 0.297
कुल लागत $0.006 $0.015
सही परीक्षण
प्रति प्रयास पास दर 33.3% 37.3%
अस्थिर टेस्ट 1 3
कुल रन 51 51
आउटपुट टोकन 1,624 2,010
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 629ms 10.83s
प्रतिक्रिया समय (अधिकतम) 1.72s 42.13s
प्रतिक्रिया समय (कुल) 10.70s 108.27s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0

त्वरित तुलना

तुलना जोड़ी बदलें