نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Elephant Alpha

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-29

میٹرک gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب Elephant Alpha Elephant Alpha none اجرا: 2026-04-14
اسکور 5.9 5.2
درجہ #103 #136
اعتماد پذیری 10.0 دستیاب نہیں
تسلسل 7.9 9.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 50.0% 29.8%
غیر مستحکم ٹیسٹ 5 1
کل رنز 60 60
فی نتیجہ لاگت 0.151 0.000
کل لاگت $0.013 $0.000
ان پٹ قیمت $0.039 / 1M $0.000 / 1M
آؤٹ پٹ قیمت $0.180 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 17,495 2,573
ریزننگ ٹوکنز 46,878 0
ردِعمل کا وقت (اوسط) 22.41s 1.22s
ردِعمل کا وقت (زیادہ سے زیادہ) 68.16s 3.81s
ردِعمل کا وقت (کل) 291.35s 22.03s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Elephant Alpha 6.6 10.0 50.0% 0 963ms 610 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.9 5.6 33.3% 1 47.24s 847 8,618
Elephant Alpha 4.7 6.7 33.3% 1 1.39s 375 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Elephant Alpha 3.0 10.0 0.0% 0 3.81s 731 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Elephant Alpha 6.5 10.0 50.0% 0 1.04s 246 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Elephant Alpha 3.0 10.0 0.0% 0 927ms 24 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Elephant Alpha 4.0 10.0 0.0% 0 854ms 106 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Elephant Alpha 9.8 10.0 100.0% 0 1.03s 81 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,790 2,264
Elephant Alpha 4.2 10.0 0.0% 0 807ms 170 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
Elephant Alpha 3.0 10.0 0.0% 0 2.79s 230 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 3,101 3,758
Elephant Alpha 0.0 0.0 0.0% 0 0ms 0 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں