নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Qwen: Qwen3.6 Max Preview

সারাংশ

GPT-5.4 Nano vs Qwen3.6 Max Preview benchmark তুলনা: GPT-5.4 Nano average score-এ এগিয়ে: 7.0 vs 6.9. Qwen3.6 Max Preview-এর benchmark খরচ কম: $0.075 vs $0.107. Qwen3.6 Max Preview দ্রুত: 3.30s vs 11.95s, pass rates 63.5% vs 58.7%.

প্রস্তাবিত মডেল: Qwen3.6 Max Preview - Its score stays close to the best score here (6.9 vs 7.0), while responding about 3.6x faster than GPT-5.4 Nano.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-10

মেট্রিক GPT-5.4 Nano GPT-5.4 Nano medium প্রকাশ: 2026-03-17 Qwen3.6 Max Preview Qwen3.6 Max Preview none প্রকাশ: 2026-04-20
স্কোর 7.0 6.9
র‍্যাঙ্ক #71 #75
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.4 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 63.5% 58.7%
অস্থির টেস্ট 4 2
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.969 0.824
মোট খরচ $0.107 $0.075
ইনপুট মূল্য $0.200 / 1M $1.040 / 1M
আউটপুট মূল্য $1.250 / 1M $6.240 / 1M
মোট ইনপুট টোকেন 35,434 42,509
আউটপুট টোকেন 3,014 4,779
রিজনিং টোকেন 76,520 0
প্রতিক্রিয়া সময় (গড়) 11.95s 3.30s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 94.06s 20.51s
প্রতিক্রিয়া সময় (মোট) 250.98s 69.40s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#71 GPT-5.4 Nano

medium
Cost
$0.007
Time
24.6s
Tokens
4,943 tok

#75 Qwen3.6 Max Preview

none
Cost
$0.025
Time
83.9s
Tokens
4,066 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0

দ্রুত তুলনা

তুলনার জুটি বদলান