नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Mistral: Mistral Small 4 vs Xiaomi: MiMo-V2-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-20

मेट्रिक Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16 MiMo-V2-Pro MiMo-V2-Pro none रिलीज़: 2026-03-18
स्कोर 5.6 5.8
रैंक #57 #54
संगति 7.0 8.5
सही परीक्षण
प्रति प्रयास पास दर 49.0% 45.1%
अस्थिर टेस्ट 6 3
कुल रन 51 51
प्रति परिणाम लागत 0.502 0.659
कुल लागत $0.026 $0.040
???? ??? $0.150 / 1M $1.000 / 1M
????? ??? $0.600 / 1M $3.000 / 1M
आउटपुट टोकन 12,288 1,721
रीजनिंग टोकन 28,112 0
प्रतिक्रिया समय (औसत) 4.18s 2.31s
प्रतिक्रिया समय (अधिकतम) 25.25s 6.58s
प्रतिक्रिया समय (कुल) 71.03s 39.25s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
MiMo-V2-Pro 3.5 8.0 16.7% 1 1.80s 315 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
MiMo-V2-Pro 3.0 10.0 0.0% 0 6.58s 333 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
MiMo-V2-Pro 10.0 10.0 100.0% 0 1.39s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
MiMo-V2-Pro 5.3 7.2 44.4% 1 1.78s 26 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
MiMo-V2-Pro 4.3 9.9 0.0% 0 2.44s 125 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
MiMo-V2-Pro 6.5 10.0 50.0% 0 2.51s 69 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
MiMo-V2-Pro 6.0 7.1 55.6% 1 1.83s 327 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.39s 277 0

त्वरित तुलना

तुलना जोड़ी बदलें