নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-Flash

সারাংশ

GPT-5.4 Mini vs Qwen3.5-Flash benchmark তুলনা: GPT-5.4 Mini average score-এ এগিয়ে: 8.0 vs 6.8. Qwen3.5-Flash-এর benchmark খরচ কম: $0.080 vs $0.526. GPT-5.4 Mini দ্রুত: 22.34s vs 63.29s, pass rates 73.0% vs 71.4%.

প্রস্তাবিত মডেল: GPT-5.4 Mini - It has the best score here (8.0), while responding about 2.8x faster than Qwen3.5-Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক GPT-5.4 Mini GPT-5.4 Mini medium প্রকাশ: 2026-03-17 Qwen3.5-Flash Qwen3.5-Flash medium প্রকাশ: 2026-02-24
স্কোর 8.0 6.8
র‍্যাঙ্ক #27 #70
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.0 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 73.0% 71.4%
অস্থির টেস্ট 5 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 4.381 0.871
মোট খরচ $0.526 $0.080
ইনপুট মূল্য $0.750 / 1M $0.065 / 1M
আউটপুট মূল্য $4.500 / 1M $0.260 / 1M
মোট ইনপুট টোকেন 34,116 38,926
আউটপুট টোকেন 2,181 2,088
রিজনিং টোকেন 108,937 294,598
প্রতিক্রিয়া সময় (গড়) 22.34s 63.29s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 138.75s 234.29s
প্রতিক্রিয়া সময় (মোট) 469.20s 1265.85s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#27 GPT-5.4 Mini

medium
খরচ
$0.056
সময়
95.5s
টোকেন
12,464 tok

#70 Qwen3.5-Flash

medium
খরচ
$0.002
সময়
25.8s
টোকেন
4,294 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

দ্রুত তুলনা

তুলনার জুটি বদলান