নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-35B-A3B

সারাংশ

GPT-5.4 Mini vs Qwen3.5-35B-A3B benchmark তুলনা: Qwen3.5-35B-A3B average score-এ এগিয়ে: 5.9 vs 5.3. Qwen3.5-35B-A3B-এর benchmark খরচ কম: $0.012 vs $0.038. GPT-5.4 Mini দ্রুত: 1.13s vs 3.37s, pass rates 30.2% vs 42.9%.

প্রস্তাবিত মডেল: Qwen3.5-35B-A3B - It has the best score here (5.9), while costing about 3.3x less than GPT-5.4 Mini.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক GPT-5.4 Mini GPT-5.4 Mini none প্রকাশ: 2026-03-17 Qwen3.5-35B-A3B Qwen3.5-35B-A3B none প্রকাশ: 2026-02-24
স্কোর 5.3 5.9
র‍্যাঙ্ক #131 #108
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 8.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 30.2% 42.9%
অস্থির টেস্ট 3 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.743 0.230
মোট খরচ $0.038 $0.012
ইনপুট মূল্য $0.750 / 1M $0.140 / 1M
আউটপুট মূল্য $4.500 / 1M $1.000 / 1M
মোট ইনপুট টোকেন 34,244 48,194
আউটপুট টোকেন 2,541 4,343
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 1.13s 3.37s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 2.52s 47.43s
প্রতিক্রিয়া সময় (মোট) 23.82s 70.75s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

#108 Qwen3.5-35B-A3B

none
Cost
$0.005
Time
28.4s
Tokens
4,518 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Qwen3.5-35B-A3B 3.4 7.9 16.7% 1 1.43s 696 574 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Qwen3.5-35B-A3B 5.5 10.0 33.3% 0 1.39s 7,808 571 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 47.43s 20,739 1,833 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 1.16s 7,794 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Qwen3.5-35B-A3B 7.7 10.0 66.7% 0 485ms 789 15 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Qwen3.5-35B-A3B 6.5 3.4 66.7% 1 1.19s 522 114 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Qwen3.5-35B-A3B 6.3 10.0 50.0% 0 809ms 711 63 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Qwen3.5-35B-A3B 3.7 7.4 22.2% 1 1.35s 714 655 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 8,211 264 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 493ms 210 11 0

দ্রুত তুলনা

তুলনার জুটি বদলান