নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.3-Codex

সারাংশ

Gemini 3.5 Flash vs GPT-5.3-Codex benchmark তুলনা: Gemini 3.5 Flash average score-এ এগিয়ে: 9.2 vs 8.9. Gemini 3.5 Flash-এর benchmark খরচ কম: $0.349 vs $0.740. Gemini 3.5 Flash দ্রুত: 3.27s vs 16.22s, pass rates 90.5% vs 82.5%.

প্রস্তাবিত মডেল: Gemini 3.5 Flash - It has the best score here (9.2), while costing about 2.1x less than GPT-5.3-Codex.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Gemini 3.5 Flash Gemini 3.5 Flash low প্রকাশ: 2026-05-19 GPT-5.3-Codex GPT-5.3-Codex medium প্রকাশ: 2026-02-05
স্কোর 9.2 8.9
র‍্যাঙ্ক #5 #10
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 10.0 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 90.5% 82.5%
অস্থির টেস্ট 0 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 1.834 4.932
মোট খরচ $0.349 $0.740
ইনপুট মূল্য $1.500 / 1M $1.750 / 1M
আউটপুট মূল্য $9.000 / 1M $14.000 / 1M
মোট ইনপুট টোকেন 36,938 34,299
আউটপুট টোকেন 2,033 2,357
রিজনিং টোকেন 30,519 46,189
প্রতিক্রিয়া সময় (গড়) 3.27s 16.22s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 9.05s 100.93s
প্রতিক্রিয়া সময় (মোট) 68.65s 340.67s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 Gemini 3.5 Flash

low
খরচ
$0.068
সময়
39.1s
টোকেন
7,588 tok

#10 GPT-5.3-Codex

medium
খরচ
$0.049
সময়
54.9s
টোকেন
3,580 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 494 209 2,536
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 606 240 1,722
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 7.8 10.0 66.7% 0 6.71s 8,118 458 13,420
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.50s 7,302 535 10,890
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 12,873 351 3,050
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 11,019 364 2,731
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 7,548 279 1,164
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 7,140 234 728
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 633 12 4,538
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 813 64 25,308
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 486 119 916
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 477 187 331
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 615 71 1,652
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 660 93 693
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 558 288 2,150
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.05s 642 356 1,593
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 5,457 234 403
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 5,445 254 492
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 156 12 690
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 195 30 1,701

দ্রুত তুলনা

তুলনার জুটি বদলান