AI BENCHY
Advertise here
#151

MiniMax M2.5

Minimax प्रकाशन: 2026-02-12 चाचणी तारीख: 2026-06-04 13:23 minimax/minimax-m2.5::medium

सारांश

MiniMax M2.5 AI BENCHY वर 4.7 स्कोर करते आणि #151 वर आहे. याची reliability 10.0, pass rate 46.0%, एकूण खर्च $0.164, आणि सरासरी response time 65.37s आहे.

MiniMax M2.5 खास का आहे: हे संयुक्त मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #10. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

सुसंगतता

6.5

एकूण खर्च (सध्याची किंमत)

$0.164 ↓ -58.7%

या किमतीवर चाचणी केली: $0.395

एकूण आउटपुट टोकन्स

440,309

एकूण इनपुट टोकन्स

43,706

इनपुट किंमत

$0.120 / 1M

आउटपुट किंमत

$0.480 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 46.0%

अस्थिर चाचण्या

9

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

65.37s

प्रतिसाद वेळ (कमाल): 251.36s

प्रतिसाद वेळ (एकूण): 849.76s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 MiniMax M2.5

medium
अवैध SVG
खर्च
$0.000
वेळ
300.0s
टोकन्स
0 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:23 नवीन चाचणी जोडली 5.3 8.9 $0.385 सध्याची रन
2026-05-21 23:48 सूट बदलला 5.4 8.3 $0.305 तुलना करा
2026-04-20 17:48 पहिली नोंदलेली रन 5.7 लागू नाही $0.250 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:23 · सध्याची रन4.76.510.05/219440,30943,706$0.16465.37s
2026-05-21 23:48 · सूट बदलला5.46.18.35/2010360,6720$0.30550.25s
फरक-0.7+0.4+1.70-1+79637+43706-$0.142+15111ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.150 / 1M $1.150 / 1M
2026-06-10 13:42 $0.150 / 1M $0.900 / 1M
2026-06-29 01:00 $0.120 / 1M $0.480 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 7.9 6.3
कोडिंग 3.4 9.1
संयुक्त 4.5 2.1
डेटा पार्सिंग आणि निष्कर्षण 4.6 1.7
डोमेन-विशिष्ट 2.9 4.4
Samanya Buddhimatta 3.8 2.5
सूचनांचे पालन 7.5 10.0
कोडी सोडवणे 5.3 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स