AI BENCHY
موازنہ کریں
❤️ Made by XCS

ماڈل کا نام

MiniMax: MiniMax M2.5

بینچ مارکس Aibenchy ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 19 فروری، 2026

میٹرک MiniMax: MiniMax M2.5
درجہ#17
کمپنیMiniMax
Score 5.08
تسلسل 6.00
فی نتیجہ لاگت 4.0276
کل لاگت $0.20138
درست ٹیسٹس 5/12
فی کوشش کامیابی کی شرح 61.1%
غیر مستحکم ٹیسٹ 6
آؤٹ پٹ ٹوکنز 121,028
ریزننگ ٹوکنز 165,110

زمرہ وار تفصیل

زمرہ مکمل طور پر کامیاب ٹیسٹ Score تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ استدلال اسکور لاگت
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

موازنہ کیے گئے ماڈلز

MiniMax: MiniMax M2.5 کا موازنہ اس کے ساتھ کریں...

#16 · Anthropic

Anthropic: Claude Opus 4.6

استدلال (medium)

Score: 5.42

تسلسل: 8.60

فی کوشش کامیابی کی شرح: 55.5%

غیر مستحکم ٹیسٹ: 2

فی نتیجہ لاگت: 12.8695

درست ٹیسٹس: 6/12

کل لاگت: $0.77217

موازنہ کریں

#18 · Stepfun

StepFun: Step 3.5 Flash

استدلال (medium)

Score: 4.92

تسلسل: 7.34

فی کوشش کامیابی کی شرح: 58.3%

غیر مستحکم ٹیسٹ: 4

فی نتیجہ لاگت: 0.0000

درست ٹیسٹس: 5/12

کل لاگت: $0.00000

موازنہ کریں

#15 · Z.ai

Z.ai: GLM 5

بغیر استدلال

Score: 5.42

تسلسل: 10.00

فی کوشش کامیابی کی شرح: 50.0%

غیر مستحکم ٹیسٹ: 0

فی نتیجہ لاگت: 0.0704

درست ٹیسٹس: 6/12

کل لاگت: $0.00423

موازنہ کریں

فوری موازنہ

MiniMax: MiniMax M2.5 کا موازنہ اس کے ساتھ کریں...