নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-35B-A3B

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-17

মেট্রিক GPT-5.4 Mini GPT-5.4 Mini medium প্রকাশ: 2026-03-17 Qwen3.5-35B-A3B Qwen3.5-35B-A3B none প্রকাশ: 2026-02-24
র‍্যাঙ্ক #34 #49
স্কোর 7.1 5.9
ধারাবাহিকতা 7.2 8.6
প্রতি ফলাফলে খরচ 3.610 0.237
মোট খরচ $0.289 $0.015
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 68.6% 47.1%
অস্থির টেস্ট 6 3
মোট রান 51 51
আউটপুট টোকেন 1,708 3,761
রিজনিং টোকেন 58,019 0
প্রতিক্রিয়া সময় (গড়) 15.66s 3.89s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 102.91s 47.43s
প্রতিক্রিয়া সময় (মোট) 266.14s 66.07s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Qwen3.5-35B-A3B 3.4 7.9 16.7% 1 1.43s 574 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 47.43s 1,833 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 1.16s 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Qwen3.5-35B-A3B 7.7 10.0 66.7% 0 485ms 15 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Qwen3.5-35B-A3B 6.5 3.4 66.7% 1 1.19s 114 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Qwen3.5-35B-A3B 6.3 10.0 50.0% 0 809ms 63 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
Qwen3.5-35B-A3B 3.9 7.4 22.2% 1 1.34s 655 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 264 0

দ্রুত তুলনা

তুলনার জুটি বদলান