#107

MiMo-V2.5

Xiaomi रिलीज़: 2026-04-22 परीक्षण किया गया: 2026-07-16 22:46 xiaomi/mimo-v2.5::medium

(medium) (none)

सारांश

MiMo-V2.5 AI BENCHY पर 6.5 स्कोर करता है और #107 पर है। इसकी reliability 10.0, pass rate 69.7%, कुल लागत $0.082, और औसत response time 32.20s है।

MiMo-V2.5 को अलग क्या बनाता है: यह संयुक्त में सबसे अलग दिखता है, जहाँ इसकी रैंक #2 है; जबकि डेटा पार्सिंग और निष्कर्षण इसकी सबसे कमजोर जगह है, जहाँ यह #14 पर है।

स्कोर

6.5

संगति

7.9

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.082 ↓ -78.3%

परीक्षण के समय: $0.375

कुल आउटपुट टोकन

237,802

कुल इनपुट टोकन

105,447

इनपुट कीमत

$0.140 / 1M

आउटपुट कीमत

$0.280 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 69.7%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

32.20s

प्रतिक्रिया समय (अधिकतम): 162.44s

प्रतिक्रिया समय (कुल): 708.46s

गलत उत्तर: 5 अतिरिक्त फॉर्मेटिंग: 2 निर्देशों का पालन नहीं किया: 1 अमान्य टूल कॉल: 1 कोई उत्तर नहीं: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#107 MiMo-V2.5

medium

लागत: $0.002
समय: 54.8s
टोकन: 5,247 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:46 नया टेस्ट जोड़ा गया	6.5	10.0	$0.082 ↓	वर्तमान रन
2026-06-04 13:56 नया टेस्ट जोड़ा गया	7.3	10.0	$0.063 ↓	तुलना करें
2026-05-22 12:59 नया टेस्ट जोड़ा गया	7.4	10.0	$0.346	तुलना करें
2026-05-08 15:28 सूट बदला गया	7.8	10.0	$0.253	तुलना करें
2026-04-22 22:54 पहला दर्ज रन	7.8	लागू नहीं	$0.253	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-07-16 22:46 · वर्तमान रन	6.5	7.9	10.0	12/22	6	237,802	105,447	$0.082	32.20s
2026-05-22 12:59 · नया टेस्ट जोड़ा गया	7.4	8.4	10.0	12/20	4	164,736	0	$0.346	20.40s
अंतर	-0.9	-0.5	0.0	0	+2	+73066	+105447	-$0.264	+11804ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.140 / 1M	$0.280 / 1M
2026-06-29 01:00	$0.105 / 1M	$0.280 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

MiMo-V2.5mediumvsQwen3.6 27Bmedium MiMo-V2.5mediumvsLaguna XS 2.1mediumनिःशुल्क उपलब्ध MiMo-V2.5mediumvsGemini 3.5 Flash-Litemedium MiMo-V2.5mediumvsQwen3.5-27Bnone MiMo-V2.5mediumvsQwen3.6 Max Previewnone MiMo-V2.5mediumvsGemini 3.1 Flash Lite Previewlow MiMo-V2.5mediumvsLongCat 2.0high MiMo-V2.5mediumvsGemini 3.1 Flash Litelow MiMo-V2.5mediumvsGLM 5.2none MiMo-V2.5mediumvsGemini 3.1 Flash Lite Previewnone

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	6.2	4.7
संयुक्त	8.7	6.9
डेटा पार्सिंग और निष्कर्षण	2.7	5.7
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	5.4	2.5
निर्देश पालन	9.9	10.0
पहेली समाधान	8.2	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

MiMo-V2.5

Hamster playing table tennis

#107 MiMo-V2.5

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल