#62

MiMo-V2-Omni

Xiaomi प्रकाशन: 2026-03-18 चाचणी तारीख: 2026-05-08 15:32 xiaomi/mimo-v2-omni::medium

(medium) (none)

स्कोअर

7.2

सुसंगतता

9.1

विश्वसनीयता

10.0

एकूण खर्च

$0.451

एकूण आउटपुट टोकन्स

218,577

???? ???

$0.400 / 1M

????? ???

$2.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 9

प्रति प्रयत्न पास दर: 59.7%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

27.58s

प्रतिसाद वेळ (कमाल): 234.19s

प्रतिसाद वेळ (एकूण): 524.03s

चुकीचे उत्तर: 5 सूचनांचे पालन केले नाही: 2 अतिरिक्त फॉरमॅटिंग: 1 उत्तर नाही: 1

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-05-22 00:27 सूट बदलला	6.9	10.0	$0.734	तुलना करा
2026-05-08 15:32 सूट बदलला	7.2	10.0	$0.451	सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन	7.7	लागू नाही	$0.153	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-05-08 15:32 · सूट बदलला	7.2	9.1	10.0	10/19	2	218,577	$0.451	27.58s
2026-05-22 00:27 · सूट बदलला	6.9	8.7	10.0	10/20	3	359,258	$0.734	41.16s
फरक	+0.2	+0.4	0.0	0	-1	-140681	-$0.283	-13582ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

MiMo-V2-OmnimediumvsRing-2.6-1Tnone MiMo-V2-OmnimediumvsGPT-5.4 Nanomedium MiMo-V2-OmnimediumvsRing-2.6-1Tmedium MiMo-V2-OmnimediumvsGPT-5.4 Minimedium MiMo-V2-OmnimediumvsGLM 5V Turbomedium MiMo-V2-OmnimediumvsQwen3.6 Max Previewnone MiMo-V2-OmnimediumvsGemini 3 Flash Previewmedium MiMo-V2-OmnimediumvsGemini 3.5 Flashhigh MiMo-V2-OmnimediumvsGemini 3.5 Flashlow

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	4.0	7.9
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	5.4	2.5
सूचनांचे पालन	8.3	10.0
कोडी सोडवणे	5.9	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

MiMo-V2-Omni

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स