نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Laguna Xs.2

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-29

میٹرک gpt-oss-120b gpt-oss-120b none اجرا: 2025-08-05 مفت دستیاب Laguna Xs.2 Laguna Xs.2 none اجرا: 2026-04-28 مفت دستیاب
اسکور 5.2 5.0
درجہ #110 #118
اعتماد پذیری دستیاب نہیں 9.9
تسلسل 7.9 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 38.9% 27.8%
غیر مستحکم ٹیسٹ 5 0
کل رنز 54 54
فی نتیجہ لاگت 0.221 0.000
کل لاگت $0.009 $0.000
?? ?? ???? $0.000 / 1M $0.000 / 1M
??? ?? ???? $0.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 44,652 3,824
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 11.96s 1.68s
ردِعمل کا وقت (زیادہ سے زیادہ) 68.97s 16.04s
ردِعمل کا وقت (کل) 179.34s 30.26s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
Laguna Xs.2 3.2 10.0 0.0% 0 743ms 933 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Laguna Xs.2 2.5 10.0 0.0% 0 1.96s 866 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Laguna Xs.2 3.0 10.0 0.0% 0 2.01s 521 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Laguna Xs.2 10.0 10.0 100.0% 0 646ms 246 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Laguna Xs.2 5.3 10.0 33.3% 0 371ms 33 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
Laguna Xs.2 5.0 10.0 0.0% 0 16.04s 200 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
Laguna Xs.2 6.5 10.0 50.0% 0 439ms 81 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
Laguna Xs.2 5.4 10.0 33.3% 0 688ms 552 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Laguna Xs.2 3.0 10.0 0.0% 0 1.93s 392 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں