نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: gpt-oss-120b

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-22

میٹرک Mistral Small 4 Mistral Small 4 medium اجرا: 2026-03-16 gpt-oss-120b gpt-oss-120b none اجرا: 2025-08-05 مفت دستیاب
اسکور 5.4 5.2
درجہ #121 #129
اعتماد پذیری 10.0 10.0
تسلسل 7.1 8.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 45.0% 36.8%
غیر مستحکم ٹیسٹ 7 3
کل رنز 60 57
فی نتیجہ لاگت 1.109 0.201
کل لاگت $0.056 $0.011
?? ?? ???? $0.150 / 1M $0.000 / 1M
??? ?? ???? $0.600 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 21,628 51,505
ریزننگ ٹوکنز 68,055 0
ردِعمل کا وقت (اوسط) 8.33s 21.86s
ردِعمل کا وقت (زیادہ سے زیادہ) 59.15s 113.71s
ردِعمل کا وقت (کل) 166.59s 349.78s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 8,676 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 5.1 6.8 33.3% 1 44.82s 9,322 38,386
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 615 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
gpt-oss-120b 4.4 4.5 44.5% 2 9.51s 3,781 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 18 1,557
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 3,138 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں