#88

MiMo-V2.5-Pro

Xiaomi प्रकाशन: 2026-04-22 चाचणी तारीख: 2026-07-16 22:50 xiaomi/mimo-v2.5-pro::medium

(medium) (none)

सारांश

MiMo-V2.5-Pro AI BENCHY वर 6.9 स्कोर करते आणि #88 वर आहे. याची reliability 10.0, pass rate 66.7%, एकूण खर्च $0.187, आणि सरासरी response time 33.92s आहे.

MiMo-V2.5-Pro खास का आहे: हे डोमेन-विशिष्ट मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #4 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #15.

स्कोअर

6.9

सुसंगतता

8.2

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.187 ↓ -51.7%

या किमतीवर चाचणी केली: $0.387

एकूण आउटपुट टोकन्स

146,513

एकूण इनपुट टोकन्स

139,883

इनपुट किंमत

$0.435 / 1M

आउटपुट किंमत

$0.870 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 10

प्रति प्रयत्न पास दर: 66.7%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

33.92s

प्रतिसाद वेळ (कमाल): 197.54s

प्रतिसाद वेळ (एकूण): 746.19s

अतिरिक्त फॉरमॅटिंग: 3 चुकीचे उत्तर: 3 सूचनांचे पालन केले नाही: 2 API त्रुटी: 1 अवैध टूल कॉल: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 MiMo-V2.5-Pro

medium

अवैध SVG

खर्च: $0.000
वेळ: 300.0s
टोकन्स: 0 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:50 नवीन चाचणी जोडली	6.9	10.0	$0.187 ↓	सध्याची रन
2026-06-04 13:52 नवीन चाचणी जोडली	7.5	10.0	$0.106 ↓	तुलना करा
2026-05-08 15:28 सूट बदलला	8.1	10.0	$0.200	तुलना करा
2026-04-22 22:54 पहिली नोंदलेली रन	8.1	लागू नाही	$0.201	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-07-16 22:50 · सध्याची रन	6.9	8.2	10.0	12/22	5	146,513	139,883	$0.187	33.92s
2026-04-22 22:54 · पहिली नोंदलेली रन	8.1	8.8	लागू नाही	12/18	3	55,306	0	$0.201	16.17s
फरक	-1.2	-0.6		0	+2	+91207	+139883	-$0.015	+17746ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.435 / 1M	$0.870 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

MiMo-V2.5-PromediumvsDeepSeek V4 Pronone MiMo-V2.5-PromediumvsKAT-Coder-Pro V2.5medium MiMo-V2.5-PromediumvsQwen3.6 Flashmedium MiMo-V2.5-PromediumvsSeed-2.0-Minimedium MiMo-V2.5-PromediumvsStep 3.7 Flashhigh MiMo-V2.5-PromediumvsGemini 3.6 Flashmedium MiMo-V2.5-PromediumvsGemini 3.6 Flashhigh MiMo-V2.5-PromediumvsNemotron 3 Ultramediumमोफत उपलब्ध MiMo-V2.5-PromediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	6.2	4.7
संयुक्त	6.9	5.9
डेटा पार्सिंग आणि निष्कर्षण	7.3	5.8
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	5.5	10.0
सूचनांचे पालन	9.9	10.0
कोडी सोडवणे	6.7	7.9
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

MiMo-V2.5-Pro

Hamster playing table tennis

#88 MiMo-V2.5-Pro

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स