নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-9B

সারাংশ

GPT-5.4 Mini vs Qwen3.5-9B benchmark তুলনা: GPT-5.4 Mini average score-এ এগিয়ে: 5.3 vs 3.8. Qwen3.5-9B-এর benchmark খরচ কম: $0.036 vs $0.038. GPT-5.4 Mini দ্রুত: 1.13s vs 82.24s, pass rates 30.2% vs 27.0%.

প্রস্তাবিত মডেল: GPT-5.4 Mini - It has the best score here (5.3), while responding about 72.5x faster than Qwen3.5-9B.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক GPT-5.4 Mini GPT-5.4 Mini none প্রকাশ: 2026-03-17 Qwen3.5-9B Qwen3.5-9B medium প্রকাশ: 2026-03-02
স্কোর 5.3 3.8
র‍্যাঙ্ক #124 #165
নির্ভরযোগ্যতা 10.0 6.7
ধারাবাহিকতা 8.8 8.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 30.2% 27.0%
অস্থির টেস্ট 3 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.743 1.187
মোট খরচ $0.038 $0.036
ইনপুট মূল্য $0.750 / 1M $0.100 / 1M
আউটপুট মূল্য $4.500 / 1M $0.150 / 1M
মোট ইনপুট টোকেন 34,244 17,070
আউটপুট টোকেন 2,541 29,045
রিজনিং টোকেন 0 209,516
প্রতিক্রিয়া সময় (গড়) 1.13s 82.24s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 2.52s 226.38s
প্রতিক্রিয়া সময় (মোট) 23.82s 1315.88s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#124 GPT-5.4 Mini

none
খরচ
$0.010
সময়
11.7s
টোকেন
2,151 tok

#165 Qwen3.5-9B

medium
খরচ
$0.001
সময়
35.9s
টোকেন
3,030 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

দ্রুত তুলনা

তুলনার জুটি বদলান