নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.4 Mini

সারাংশ

Gemini 3.5 Flash vs GPT-5.4 Mini benchmark তুলনা: GPT-5.4 Mini average score-এ এগিয়ে: 8.0 vs 7.0. GPT-5.4 Mini-এর benchmark খরচ কম: $0.526 vs $1.079. Gemini 3.5 Flash দ্রুত: 9.93s vs 22.34s, pass rates 77.8% vs 73.0%.

প্রস্তাবিত মডেল: GPT-5.4 Mini - It has the best score here (8.0), while costing about 2.1x less than Gemini 3.5 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Gemini 3.5 Flash Gemini 3.5 Flash none প্রকাশ: 2026-05-19 GPT-5.4 Mini GPT-5.4 Mini medium প্রকাশ: 2026-03-17
স্কোর 7.0 8.0
র‍্যাঙ্ক #66 #30
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.9 8.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 77.8% 73.0%
অস্থির টেস্ট 3 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 7.190 4.381
মোট খরচ $1.079 $0.526
ইনপুট মূল্য $1.500 / 1M $0.750 / 1M
আউটপুট মূল্য $9.000 / 1M $4.500 / 1M
মোট ইনপুট টোকেন 13,843 34,116
আউটপুট টোকেন 117,518 2,181
রিজনিং টোকেন 0 108,937
প্রতিক্রিয়া সময় (গড়) 9.93s 22.34s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 64.36s 138.75s
প্রতিক্রিয়া সময় (মোট) 178.68s 469.20s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
Cost
$0.225
Time
125.5s
Tokens
25,004 tok

#30 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174

দ্রুত তুলনা

তুলনার জুটি বদলান