নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-Flash

সারাংশ

GPT-5.4 vs Qwen3.5-Flash benchmark তুলনা: Qwen3.5-Flash average score-এ এগিয়ে: 6.1 vs 5.8. Qwen3.5-Flash-এর benchmark খরচ কম: $0.005 vs $0.122. GPT-5.4 দ্রুত: 1.42s vs 3.58s, pass rates 36.5% vs 39.7%.

প্রস্তাবিত মডেল: Qwen3.5-Flash - It has the best score here (6.1), while costing about 29.5x less than GPT-5.4.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক GPT-5.4 GPT-5.4 none প্রকাশ: 2026-03-05 Qwen3.5-Flash Qwen3.5-Flash none প্রকাশ: 2026-02-24
স্কোর 5.8 6.1
র‍্যাঙ্ক #112 #97
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 9.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 36.5% 39.7%
অস্থির টেস্ট 2 1
মোট রান 63 63
প্রতি ফলাফলে খরচ 1.740 0.075
মোট খরচ $0.122 $0.005
ইনপুট মূল্য $2.500 / 1M $0.065 / 1M
আউটপুট মূল্য $15.000 / 1M $0.260 / 1M
মোট ইনপুট টোকেন 34,212 46,439
আউটপুট টোকেন 2,417 4,276
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 1.42s 3.58s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 2.95s 27.18s
প্রতিক্রিয়া সময় (মোট) 29.87s 75.28s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#112 GPT-5.4

none
খরচ
$0.026
সময়
18.1s
টোকেন
1,792 tok

#97 Qwen3.5-Flash

none
খরচ
$0.003
সময়
47.4s
টোকেন
7,799 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 696 690 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
Qwen3.5-Flash 5.5 10.0 33.3% 0 850ms 7,913 519 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 18,879 1,794 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 7,794 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 789 15 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 522 100 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 711 63 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
Qwen3.5-Flash 3.1 10.0 0.0% 0 10.89s 714 579 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 8,211 264 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 588ms 210 9 0

দ্রুত তুলনা

তুলনার জুটি বদলান