নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs OpenAI: GPT-5.4

সারাংশ

Gemini 2.5 Flash vs GPT-5.4 benchmark তুলনা: Gemini 2.5 Flash average score-এ এগিয়ে: 6.2 vs 5.8. Gemini 2.5 Flash-এর benchmark খরচ কম: $0.016 vs $0.122. Gemini 2.5 Flash দ্রুত: 875ms vs 1.42s, pass rates 46.0% vs 36.5%.

প্রস্তাবিত মডেল: Gemini 2.5 Flash - It has the best score here (6.2), while costing about 8.0x less than GPT-5.4.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Gemini 2.5 Flash Gemini 2.5 Flash none প্রকাশ: 2025-06-17 GPT-5.4 GPT-5.4 none প্রকাশ: 2026-03-05
স্কোর 6.2 5.8
র‍্যাঙ্ক #93 #112
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.6 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 46.0% 36.5%
অস্থির টেস্ট 1 2
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.169 1.740
মোট খরচ $0.016 $0.122
ইনপুট মূল্য $0.300 / 1M $2.500 / 1M
আউটপুট মূল্য $2.500 / 1M $15.000 / 1M
মোট ইনপুট টোকেন 35,926 34,212
আউটপুট টোকেন 1,770 2,417
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 875ms 1.42s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 4.39s 2.95s
প্রতিক্রিয়া সময় (মোট) 18.37s 29.87s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#93 Gemini 2.5 Flash

none
অবৈধ SVG
খরচ
$0.164
সময়
215.5s
টোকেন
65,659 tok

#112 GPT-5.4

none
খরচ
$0.026
সময়
18.1s
টোকেন
1,792 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 492 102 0
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 5.5 10.0 33.3% 0 736ms 8,122 483 0
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 12,519 366 0
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 7,257 279 0
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 633 12 0
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 486 78 0
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 615 72 0
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 558 132 0
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 5,088 234 0
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 156 12 0
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0

দ্রুত তুলনা

তুলনার জুটি বদলান