AI BENCHY
Advertise here
#164

MiMo-V2-Flash

Xiaomi प्रकाशन: 2025-12-16 चाचणी तारीख: 2026-06-04 13:47 xiaomi/mimo-v2-flash::none
(medium) (none)

सारांश

MiMo-V2-Flash AI BENCHY वर 4.3 स्कोर करते आणि #164 वर आहे. याची reliability 6.7, pass rate 25.4%, एकूण खर्च $0.025, आणि सरासरी response time 2.76s आहे.

MiMo-V2-Flash खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

संग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.

सुसंगतता

8.5

एकूण खर्च (सध्याची किंमत)

$0.025 ↑ +4.2%

या किमतीवर चाचणी केली: $0.024

एकूण आउटपुट टोकन्स

68,882

एकूण इनपुट टोकन्स

36,851

इनपुट किंमत

$0.100 / 1M

आउटपुट किंमत

$0.300 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 17

प्रति प्रयत्न पास दर: 25.4%

अस्थिर चाचण्या

4

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

2.76s

प्रतिसाद वेळ (कमाल): 19.68s

प्रतिसाद वेळ (एकूण): 46.99s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#164 MiMo-V2-Flash

none
खर्च
$0.001
वेळ
7.7s
टोकन्स
1,481 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:47 नवीन चाचणी जोडली 4.6 6.7 $0.025 सध्याची रन
2026-05-22 00:20 सूट बदलला 4.4 10.0 $0.024 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 4.5 लागू नाही $0.023 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:47 · सध्याची रन4.38.56.74/21468,88236,851$0.0252.76s
2026-04-11 01:44 · पहिली नोंदलेली रन4.57.8लागू नाही3/18568,5220$0.0232.79s
फरक-0.3+0.7+1-1+360+36851+$0.002-28ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.100 / 1M $0.300 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.2 8.0
कोडिंग 4.3 7.9
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 2.9 5.8
डोमेन-विशिष्ट 5.3 7.2
Samanya Buddhimatta 4.6 10.0
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 5.3 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स