نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.4 Mini

خلاصہ

Gemini 3.1 Flash Lite Preview vs GPT-5.4 Mini benchmark موازنہ: GPT-5.4 Mini average score میں آگے ہے: 8.0 vs 6.5. Gemini 3.1 Flash Lite Preview کی benchmark لاگت کم ہے: $0.026 vs $0.526. Gemini 3.1 Flash Lite Preview تیز ہے: 2.77s vs 22.34s، pass rates 61.9% vs 73.0%.

تجویز کردہ ماڈل: Gemini 3.1 Flash Lite Preview - It offers the best overall trade-off: a competitive score (6.5), lower cost than GPT-5.4 Mini, and balanced response time.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-18

میٹرک Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low اجرا: 2026-03-03 GPT-5.4 Mini GPT-5.4 Mini medium اجرا: 2026-03-17
اسکور 6.5 8.0
درجہ #82 #27
اعتماد پذیری 10.0 10.0
تسلسل 10.0 8.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 61.9% 73.0%
غیر مستحکم ٹیسٹ 0 5
کل رنز 63 63
فی نتیجہ لاگت 0.196 4.381
کل لاگت $0.026 $0.526
ان پٹ قیمت $0.250 / 1M $0.750 / 1M
آؤٹ پٹ قیمت $1.500 / 1M $4.500 / 1M
کل ان پٹ ٹوکنز 32,715 34,116
آؤٹ پٹ ٹوکنز 2,286 2,181
ریزننگ ٹوکنز 9,166 108,937
ردِعمل کا وقت (اوسط) 2.77s 22.34s
ردِعمل کا وقت (زیادہ سے زیادہ) 11.91s 138.75s
ردِعمل کا وقت (کل) 58.12s 469.20s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#82 Gemini 3.1 Flash Lite Preview

low
لاگت
$0.002
وقت
3.7s
ٹوکنز
1,203 tok

#27 GPT-5.4 Mini

medium
لاگت
$0.056
وقت
95.5s
ٹوکنز
12,464 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں