নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-17

মেট্রিক GPT-5.4 GPT-5.4 medium প্রকাশ: 2026-03-05 Qwen3.5-Flash Qwen3.5-Flash medium প্রকাশ: 2026-02-24
র‍্যাঙ্ক #15 #19
স্কোর 8.1 8.0
ধারাবাহিকতা 8.6 7.6
প্রতি ফলাফলে খরচ 6.613 0.688
মোট খরচ $0.794 $0.076
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 78.4% 82.4%
অস্থির টেস্ট 3 5
মোট রান 51 51
আউটপুট টোকেন 1,780 1,827
রিজনিং টোকেন 46,687 179,299
প্রতিক্রিয়া সময় (গড়) 18.95s 67.96s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 100.41s 234.29s
প্রতিক্রিয়া সময় (মোট) 322.23s 1155.28s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Qwen3.5-Flash 6.4 4.4 77.8% 2 56.74s 162 24,276
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

দ্রুত তুলনা

তুলনার জুটি বদলান