نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs OpenAI: gpt-oss-120b

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک MiniMax: MiniMax M2.5 medium اجرا: ریلیز کی تاریخ نامعلوم OpenAI: gpt-oss-120b medium اجرا: ریلیز کی تاریخ نامعلوم مفت دستیاب
درجہ #26 #25
اسکور 5.64 5.64
تسلسل 6.12 7.55
فی نتیجہ لاگت 4.028 0.101
کل لاگت $0.242 $0.008
درست ٹیسٹس
غلط ٹیسٹس 8 7
فی کوشش کامیابی کی شرح 64.3% 59.5%
غیر مستحکم ٹیسٹ 7 4
آؤٹ پٹ ٹوکنز 121,297 11,407
ریزننگ ٹوکنز 203,513 26,106

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
MiniMax: MiniMax M2.5 9.33 7.89 88.9% 1 286 45,112
OpenAI: gpt-oss-120b 7.00 9.81 66.7% 0 3,463 2,077
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
MiniMax: MiniMax M2.5 5.50 5.81 83.3% 1 369 4,952
OpenAI: gpt-oss-120b 5.50 5.87 66.7% 1 241 1,114
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
MiniMax: MiniMax M2.5 1.00 4.41 22.2% 2 111,023 139,533
OpenAI: gpt-oss-120b 1.00 4.41 22.2% 2 6,018 18,520
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
MiniMax: MiniMax M2.5 7.00 6.41 66.7% 1 1,121 2,521
OpenAI: gpt-oss-120b 10.00 10.00 100.0% 0 120 1,770
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
MiniMax: MiniMax M2.5 4.33 4.79 55.6% 2 8,229 10,458
OpenAI: gpt-oss-120b 5.00 7.13 44.4% 1 1,278 1,542
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
MiniMax: MiniMax M2.5 10.00 10.00 100.0% 0 269 937
OpenAI: gpt-oss-120b 9.00 9.97 100.0% 0 287 1,083

موازنہ کی جوڑی تبدیل کریں