#128

Mimo V2 PRO

Xiaomi प्रकाशन: 2026-03-18 चाचणी तारीख: 2026-06-04 13:47 xiaomi/mimo-v2-pro::medium

(medium) (none)

सारांश

Mimo V2 PRO AI BENCHY वर 6.3 स्कोर करते आणि #128 वर आहे. याची reliability 9.6, pass rate 69.7%, एकूण खर्च $0.333, आणि सरासरी response time 22.16s आहे.

Mimo V2 PRO खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #2 आहे; तर संयुक्त हा सर्वात कमकुवत भाग आहे, rank #16.

संग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.

ओळख नोंद

Hunter Alpha हे Mimo V2 PRO चे स्टेल्थ आवृत्ती होते.

स्कोअर

6.3

सुसंगतता

7.7

विश्वसनीयता

9.6

एकूण खर्च (सध्याची किंमत)

$0.333 ↑ +13.1%

या किमतीवर चाचणी केली: $0.294

एकूण आउटपुट टोकन्स

84,319

एकूण इनपुट टोकन्स

40,961

इनपुट किंमत

$2.653 / 1M

आउटपुट किंमत

$2.653 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 9

प्रति प्रयत्न पास दर: 69.7%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

22.16s

प्रतिसाद वेळ (कमाल): 136.29s

प्रतिसाद वेळ (एकूण): 443.22s

चुकीचे उत्तर: 5 API त्रुटी: 1 अतिरिक्त फॉरमॅटिंग: 1 सूचनांचे पालन केले नाही: 1 वेळ संपला: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#128 Mimo V2 PRO

medium

This model has been deprecated. It is recommended to migrate to xiaomi/mimo-v2.5-pro

खर्च: $0.000
वेळ: 0.1s
टोकन्स: 0 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:47 नवीन चाचणी जोडली	6.3	9.6	$0.333 ↑	सध्याची रन
2026-05-22 00:25 सूट बदलला	7.6	9.5	$0.295	तुलना करा
2026-05-08 15:32 सूट बदलला	7.7	9.4	$0.212	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	8.1	लागू नाही	$0.159	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	बेंचमार्क कव्हरेज	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-06-04 13:47 · सध्याची रन	21/22 चाचण्या · 63/66 प्रयत्न	6.3	7.7	9.6	12/21	5	84,319	40,961	$0.333	22.16s
2026-05-08 15:32 · सूट बदलला	19/19 चाचण्या · 57/57 प्रयत्न	7.7	8.2	9.4	12/19	4	58,330	0	$0.212	16.18s
फरक	—	-1.4	-0.5	+0.2	0	+1	+25989	+40961	+$0.121	+5978ms

बेंचमार्क कव्हरेज वेगळे आहे: 21/21 चाचण्या · 63/63 प्रयत्न (लक्ष्य: प्रत्येक चाचणीसाठी 3 पुनरावृत्ती) विरुद्ध 19/19 चाचण्या · 57/57 प्रयत्न (लक्ष्य: प्रत्येक चाचणीसाठी 3 पुनरावृत्ती). एकूण मूल्ये आणि पुनरावृत्तीवर अवलंबून मेट्रिक्स थेट तुलना करता येत नाहीत.

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$2.653 / 1M	$2.653 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	6.0	7.4
संयुक्त	2.3	8.0
डेटा पार्सिंग आणि निष्कर्षण	7.3	5.8
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	9.9	10.0
कोडी सोडवणे	6.4	4.4
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Mimo V2 PRO

Hamster playing table tennis

#128 Mimo V2 PRO

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स