नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Mistral: Mistral Small 4 vs MoonshotAI: Kimi K2.5

सारांश

Mistral Small 4 vs Kimi K2.5 benchmark तुलना: Kimi K2.5 average score में आगे है: 5.5 vs 5.1. Kimi K2.5 की benchmark लागत कम है: $0.028 vs $0.068. Mistral Small 4 तेज है: 9.40s vs 13.18s, pass rates 44.4% vs 34.9%.

अनुशंसित मॉडल: Kimi K2.5 - It has the best score here (5.5), while costing about 2.5x less than Mistral Small 4.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16 Kimi K2.5 Kimi K2.5 none रिलीज़: 2026-01-27
स्कोर 5.1 5.5
रैंक #138 #121
विश्वसनीयता 10.0 10.0
संगति 6.9 8.9
सही परीक्षण
प्रति प्रयास पास दर 44.4% 34.9%
अस्थिर टेस्ट 8 3
कुल रन 63 63
प्रति परिणाम लागत 1.344 0.442
कुल लागत $0.068 $0.028
इनपुट कीमत $0.150 / 1M $0.400 / 1M
आउटपुट कीमत $0.600 / 1M $1.900 / 1M
कुल इनपुट टोकन 42,576 36,034
आउटपुट टोकन 24,184 6,657
रीजनिंग टोकन 84,678 0
प्रतिक्रिया समय (औसत) 9.40s 13.18s
प्रतिक्रिया समय (अधिकतम) 59.15s 42.13s
प्रतिक्रिया समय (कुल) 197.39s 184.47s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Mistral Small 4

medium
Cost
$0.006
Time
47.9s
Tokens
9,857 tok

#121 MoonshotAI: Kimi K2.5

none
Cost
$0.015
Time
89.1s
Tokens
5,421 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 708 4,055 4,778
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 652 373 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.4 5.1 33.3% 2 39.98s 7,636 11,635 54,715
Kimi K2.5 5.5 10.0 33.3% 0 24.56s 7,311 4,708 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 18,706 2,612 10,700
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 12,264 748 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 6,171 335 723
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 7,180 187 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 742 2,621 6,904
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 753 29 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 519 821 828
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 483 76 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 729 540 1,031
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 677 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 9.7 0.0% 0 2.17s 735 1,226 2,632
Kimi K2.5 3.0 10.0 0.0% 0 4.04s 667 236 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 6,420 321 810
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 5,835 220 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 210 18 1,557
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 212 20 0

त्वरित तुलना

तुलना जोड़ी बदलें