نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: gpt-oss-120b

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-01

میٹرک Mistral Small 4 Mistral Small 4 none اجرا: 2026-03-16 gpt-oss-120b gpt-oss-120b none اجرا: 2025-08-05 مفت دستیاب
اسکور 5.2 5.4
درجہ #115 #106
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 9.5 8.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 31.5% 40.7%
غیر مستحکم ٹیسٹ 1 4
کل رنز 54 54
فی نتیجہ لاگت 0.118 0.177
کل لاگت $0.006 $0.009
?? ?? ???? $0.150 / 1M $0.000 / 1M
??? ?? ???? $0.600 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 2,207 44,652
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 665ms 11.96s
ردِعمل کا وقت (زیادہ سے زیادہ) 1.72s 68.97s
ردِعمل کا وقت (کل) 11.97s 179.34s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 4.5 9.0 0.0% 0 1.28s 583 0
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں