AI BENCHY
तुलना करें
❤️ Made by XCS

मॉडल नाम

MiniMax: MiniMax M2.5

बेंचमार्क Aibenchy टेस्ट सूट्स से इस समय जनरेट किए गए: : 19 फ़र॰ 2026

मेट्रिक MiniMax: MiniMax M2.5
रैंक#17
कंपनीMiniMax
Score 5.08
संगति 6.00
प्रति परिणाम लागत 4.0276
कुल लागत $0.20138
सही परीक्षण 5/12
प्रति प्रयास पास दर 61.1%
अस्थिर टेस्ट 6
आउटपुट टोकन 121,028
रीजनिंग टोकन 165,110

श्रेणी विवरण

श्रेणी पूरी तरह पास टेस्ट Score संगति प्रति प्रयास पास दर अस्थिर टेस्ट तर्क स्कोर लागत
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

तुलना किए गए मॉडल

MiniMax: MiniMax M2.5 की तुलना इससे करें...

#16 · Anthropic

Anthropic: Claude Opus 4.6

तर्क (medium)

Score: 5.42

संगति: 8.60

प्रति प्रयास पास दर: 55.5%

अस्थिर टेस्ट: 2

प्रति परिणाम लागत: 12.8695

सही परीक्षण: 6/12

कुल लागत: $0.77217

तुलना करें

#18 · Stepfun

StepFun: Step 3.5 Flash

तर्क (medium)

Score: 4.92

संगति: 7.34

प्रति प्रयास पास दर: 58.3%

अस्थिर टेस्ट: 4

प्रति परिणाम लागत: 0.0000

सही परीक्षण: 5/12

कुल लागत: $0.00000

तुलना करें

#15 · Z.ai

Z.ai: GLM 5

बिना तर्क

Score: 5.42

संगति: 10.00

प्रति प्रयास पास दर: 50.0%

अस्थिर टेस्ट: 0

प्रति परिणाम लागत: 0.0704

सही परीक्षण: 6/12

कुल लागत: $0.00423

तुलना करें

त्वरित तुलना

MiniMax: MiniMax M2.5 की तुलना इससे करें...