نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Owl Alpha

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-01

میٹرک gpt-oss-120b gpt-oss-120b none اجرا: 2025-08-05 مفت دستیاب Owl Alpha Owl Alpha medium اجرا: 2026-04-30
اسکور 5.4 5.8
درجہ #106 #92
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 8.2 9.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 40.7% 40.7%
غیر مستحکم ٹیسٹ 4 1
کل رنز 54 54
فی نتیجہ لاگت 0.177 0.000
کل لاگت $0.009 $0.000
?? ?? ???? $0.000 / 1M $0.000 / 1M
??? ?? ???? $0.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 44,652 1,596
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 11.96s 11.04s
ردِعمل کا وقت (زیادہ سے زیادہ) 68.97s 58.63s
ردِعمل کا وقت (کل) 179.34s 198.65s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
Owl Alpha 3.4 7.2 11.1% 1 3.44s 135 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں