AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#134

MiniMax M2.7

Minimax प्रकाशन: 2026-03-18 चाचणी तारीख: 2026-06-04 13:26 minimax/minimax-m2.7::medium

सारांश

MiniMax M2.7 AI BENCHY वर 5.2 स्कोर करते आणि #134 वर आहे. याची reliability 10.0, pass rate 46.0%, एकूण खर्च $0.104, आणि सरासरी response time 38.18s आहे.

MiniMax M2.7 खास का आहे: हे अँटी-एआय युक्त्या मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर Samanya Buddhimatta हा सर्वात कमकुवत भाग आहे, rank #14. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

सुसंगतता

6.8

एकूण खर्च (सध्याची किंमत)

$0.104 ↓ -16.6%

या किमतीवर चाचणी केली: $0.125

एकूण आउटपुट टोकन्स

98,793

एकूण इनपुट टोकन्स

34,371

इनपुट किंमत

$0.250 / 1M

आउटपुट किंमत

$1.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 46.0%

अस्थिर चाचण्या

8

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

38.18s

प्रतिसाद वेळ (कमाल): 196.21s

प्रतिसाद वेळ (एकूण): 763.60s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#134 MiniMax M2.7

medium
Cost
$0.022
Time
22.8s
Tokens
9,250 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:26 नवीन चाचणी जोडली 5.3 7.8 $0.124 सध्याची रन
2026-05-21 23:52 सूट बदलला 5.0 8.3 $0.104 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 5.3 लागू नाही $0.091 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:26 · सध्याची रन5.26.810.05/21898,79334,371$0.10438.18s
2026-04-11 01:44 · पहिली नोंदलेली रन5.35.5लागू नाही4/181067,7710$0.09131.08s
फरक-0.1+1.3+1-2+31022+34371+$0.014+7100ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.279 / 1M $1.200 / 1M
2026-06-10 13:42 $0.270 / 1M $1.080 / 1M
2026-06-12 18:42 $0.250 / 1M $1.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 7.9 6.3
कोडिंग 5.7 9.1
संयुक्त 4.7 1.6
डेटा पार्सिंग आणि निष्कर्षण 6.3 5.8
डोमेन-विशिष्ट 3.0 10.0
Samanya Buddhimatta 3.9 2.5
सूचनांचे पालन 3.8 5.8
कोडी सोडवणे 5.9 7.2
टूल कॉलिंग 4.7 1.6
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स