نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Owl Alpha

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-30

میٹرک gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب Owl Alpha Owl Alpha medium اجرا: 2026-04-30
اسکور 5.8 5.8
درجہ #90 #91
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 7.2 9.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 51.9% 40.7%
غیر مستحکم ٹیسٹ 6 1
کل رنز 54 54
فی نتیجہ لاگت 0.144 0.000
کل لاگت $0.011 $0.000
?? ?? ???? $0.000 / 1M $0.000 / 1M
??? ?? ???? $0.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 13,493 1,596
ریزننگ ٹوکنز 36,879 0
ردِعمل کا وقت (اوسط) 16.08s 11.04s
ردِعمل کا وقت (زیادہ سے زیادہ) 50.92s 58.63s
ردِعمل کا وقت (کل) 176.88s 198.65s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
Owl Alpha 3.4 7.2 11.1% 1 3.44s 135 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں