নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.6 Plus

সারাংশ

GPT-5.4 Mini vs Qwen3.6 Plus benchmark তুলনা: GPT-5.4 Mini average score-এ এগিয়ে: 8.0 vs 7.8. Qwen3.6 Plus-এর benchmark খরচ কম: $0.294 vs $0.526. GPT-5.4 Mini দ্রুত: 22.34s vs 30.70s, pass rates 73.0% vs 69.8%.

প্রস্তাবিত মডেল: Qwen3.6 Plus - Its score stays close to the best score here (7.8 vs 8.0), while costing about 1.8x less than GPT-5.4 Mini.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-17

মেট্রিক GPT-5.4 Mini GPT-5.4 Mini medium প্রকাশ: 2026-03-17 Qwen3.6 Plus Qwen3.6 Plus medium প্রকাশ: 2026-04-20
স্কোর 8.0 7.8
র‍্যাঙ্ক #27 #30
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.0 9.3
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 73.0% 69.8%
অস্থির টেস্ট 5 2
মোট রান 63 63
প্রতি ফলাফলে খরচ 4.381 0.831
মোট খরচ $0.526 $0.294
ইনপুট মূল্য $0.750 / 1M $0.325 / 1M
আউটপুট মূল্য $4.500 / 1M $1.950 / 1M
মোট ইনপুট টোকেন 34,116 41,565
আউটপুট টোকেন 2,181 1,853
রিজনিং টোকেন 108,937 141,973
প্রতিক্রিয়া সময় (গড়) 22.34s 30.70s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 138.75s 201.68s
প্রতিক্রিয়া সময় (মোট) 469.20s 613.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#27 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

#30 Qwen3.6 Plus

medium
Cost
$0.024
Time
219.0s
Tokens
12,235 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 672 207 7,557
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
Qwen3.6 Plus 6.1 7.8 44.4% 1 153.12s 7,098 58 50,586
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 14,934 452 13,073
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 7,782 270 10,706
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 771 56 33,464
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 516 111 5,232
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 699 102 5,552
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.34s 696 309 6,712
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 8,193 267 1,330
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174
Qwen3.6 Plus 3.0 10.0 0.0% 0 47.51s 204 21 7,761

দ্রুত তুলনা

তুলনার জুটি বদলান