#88

MiMo-V2.5-Pro

Xiaomi रिलीज़: 2026-04-22 परीक्षण किया गया: 2026-07-16 22:50 xiaomi/mimo-v2.5-pro::medium

(medium) (none)

सारांश

MiMo-V2.5-Pro AI BENCHY पर 6.9 स्कोर करता है और #88 पर है। इसकी reliability 10.0, pass rate 66.7%, कुल लागत $0.187, और औसत response time 33.92s है।

MiMo-V2.5-Pro को अलग क्या बनाता है: यह डोमेन-विशिष्ट में सबसे अलग दिखता है, जहाँ इसकी रैंक #4 है; जबकि डेटा पार्सिंग और निष्कर्षण इसकी सबसे कमजोर जगह है, जहाँ यह #15 पर है।

स्कोर

6.9

संगति

8.2

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.187 ↓ -51.7%

परीक्षण के समय: $0.387

कुल आउटपुट टोकन

146,513

कुल इनपुट टोकन

139,883

इनपुट कीमत

$0.435 / 1M

आउटपुट कीमत

$0.870 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 66.7%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

33.92s

प्रतिक्रिया समय (अधिकतम): 197.54s

प्रतिक्रिया समय (कुल): 746.19s

अतिरिक्त फॉर्मेटिंग: 3 गलत उत्तर: 3 निर्देशों का पालन नहीं किया: 2 API त्रुटि: 1 अमान्य टूल कॉल: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 MiMo-V2.5-Pro

medium

अमान्य SVG

लागत: $0.000
समय: 300.0s
टोकन: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:50 नया टेस्ट जोड़ा गया	6.9	10.0	$0.187 ↓	वर्तमान रन
2026-06-04 13:52 नया टेस्ट जोड़ा गया	7.5	10.0	$0.106 ↓	तुलना करें
2026-05-08 15:28 सूट बदला गया	8.1	10.0	$0.200	तुलना करें
2026-04-22 22:54 पहला दर्ज रन	8.1	लागू नहीं	$0.201	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-07-16 22:50 · वर्तमान रन	6.9	8.2	10.0	12/22	5	146,513	139,883	$0.187	33.92s
2026-04-22 22:54 · पहला दर्ज रन	8.1	8.8	लागू नहीं	12/18	3	55,306	0	$0.201	16.17s
अंतर	-1.2	-0.6		0	+2	+91207	+139883	-$0.015	+17746ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.435 / 1M	$0.870 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

MiMo-V2.5-PromediumvsGPT-5.6 Solnone MiMo-V2.5-PromediumvsQwen3.6 Flashmedium MiMo-V2.5-PromediumvsDeepSeek V4 Pronone MiMo-V2.5-PromediumvsStep 3.7 Flashhigh MiMo-V2.5-PromediumvsKAT-Coder-Pro V2.5medium MiMo-V2.5-PromediumvsGPT-5.5none MiMo-V2.5-PromediumvsSeed-2.0-Minimedium MiMo-V2.5-PromediumvsGemini 3.5 Flashminimal MiMo-V2.5-PromediumvsGemini 3.5 Flashnone MiMo-V2.5-PromediumvsGemini 3 Flash Previewnone

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	6.2	4.7
संयुक्त	6.9	5.9
डेटा पार्सिंग और निष्कर्षण	7.3	5.8
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	5.5	10.0
निर्देश पालन	9.9	10.0
पहेली समाधान	6.7	7.9
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

MiMo-V2.5-Pro

Hamster playing table tennis

#88 MiMo-V2.5-Pro

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल