نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.4 Mini

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-17

میٹرک Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium اجرا: 2026-02-19 GPT-5.4 Mini GPT-5.4 Mini none اجرا: 2026-03-17
درجہ #2 #66
اسکور 9.6 4.8
تسلسل 10.0 8.6
فی نتیجہ لاگت 3.257 0.737
کل لاگت $0.522 $0.030
درست ٹیسٹس
فی کوشش کامیابی کی شرح 94.1% 31.4%
غیر مستحکم ٹیسٹ 0 3
کل رنز 51 51
آؤٹ پٹ ٹوکنز 1,527 2,085
ریزننگ ٹوکنز 36,341 0
ردِعمل کا وقت (اوسط) 15.56s 1.17s
ردِعمل کا وقت (زیادہ سے زیادہ) 40.61s 2.52s
ردِعمل کا وقت (کل) 155.64s 19.82s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں