নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5 Plus 2026-02-15

সারাংশ

GPT-5.4 Mini vs Qwen3.5 Plus 2026-02-15 benchmark তুলনা: average score প্রায় সমান: 8.0 vs 8.0. Qwen3.5 Plus 2026-02-15-এর benchmark খরচ কম: $0.310 vs $0.526. GPT-5.4 Mini দ্রুত: 22.34s vs 73.79s, pass rates 73.0% vs 73.0%.

প্রস্তাবিত মডেল: GPT-5.4 Mini - It has the best score here (8.0), while responding about 3.3x faster than Qwen3.5 Plus 2026-02-15.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-17

মেট্রিক GPT-5.4 Mini GPT-5.4 Mini medium প্রকাশ: 2026-03-17 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium প্রকাশ: 2026-02-15
স্কোর 8.0 8.0
র‍্যাঙ্ক #27 #28
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.0 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 73.0% 73.0%
অস্থির টেস্ট 5 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 4.381 2.445
মোট খরচ $0.526 $0.310
ইনপুট মূল্য $0.750 / 1M $0.260 / 1M
আউটপুট মূল্য $4.500 / 1M $1.560 / 1M
মোট ইনপুট টোকেন 34,116 40,918
আউটপুট টোকেন 2,181 2,159
রিজনিং টোকেন 108,937 189,604
প্রতিক্রিয়া সময় (গড়) 22.34s 73.79s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 138.75s 266.69s
প্রতিক্রিয়া সময় (মোট) 469.20s 1033.07s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#27 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

#28 Qwen3.5 Plus 2026-02-15

medium
Cost
$0.011
Time
125.5s
Tokens
7,040 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 672 205 21,236
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
Qwen3.5 Plus 2026-02-15 6.6 7.1 44.4% 1 180.70s 6,950 420 80,595
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 14,934 421 7,906
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 7,782 270 14,916
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 444 35 16,680
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 344 73 8,675
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 699 101 7,704
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 696 301 13,853
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 8,193 309 909
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 204 24 17,130

দ্রুত তুলনা

তুলনার জুটি বদলান