نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Laguna Xs.2

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-01

میٹرک GPT-5.4 Mini GPT-5.4 Mini none اجرا: 2026-03-17 Laguna Xs.2 Laguna Xs.2 medium اجرا: 2026-04-28 مفت دستیاب
اسکور 5.1 6.2
درجہ #117 #81
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 8.6 6.9
درست ٹیسٹس
فی کوشش کامیابی کی شرح 35.2% 57.4%
غیر مستحکم ٹیسٹ 3 7
کل رنز 54 54
فی نتیجہ لاگت 0.630 0.000
کل لاگت $0.032 $0.000
?? ?? ???? $0.750 / 1M $0.000 / 1M
??? ?? ???? $4.500 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 2,418 58,141
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 1.17s 6.03s
ردِعمل کا وقت (زیادہ سے زیادہ) 2.52s 29.11s
ردِعمل کا وقت (کل) 21.01s 108.59s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Laguna Xs.2 7.4 5.9 83.3% 2 2.60s 5,283 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
Laguna Xs.2 6.3 3.7 33.3% 1 14.36s 7,896 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Laguna Xs.2 3.0 10.0 0.0% 0 15.92s 8,501 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Laguna Xs.2 7.1 5.6 83.3% 1 9.34s 10,472 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Laguna Xs.2 4.1 4.4 44.5% 2 11.12s 18,712 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Laguna Xs.2 4.1 10.0 0.0% 0 2.76s 1,421 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Laguna Xs.2 10.0 10.0 100.0% 0 1.68s 1,517 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Laguna Xs.2 5.3 10.0 33.3% 0 2.12s 3,168 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Laguna Xs.2 4.7 1.6 66.7% 1 3.39s 1,171 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں