নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.7 Max

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-22

মেট্রিক GPT-5.4 GPT-5.4 medium প্রকাশ: 2026-03-05 Qwen3.7 Max Qwen3.7 Max none প্রকাশ: 2026-05-22
স্কোর 7.9 7.9
র‍্যাঙ্ক #28 #27
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.5 10.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 75.0% 70.0%
অস্থির টেস্ট 4 0
মোট রান 60 60
প্রতি ফলাফলে খরচ 8.767 0.719
মোট খরচ $1.140 $0.101
???? ??? $2.500 / 1M $2.500 / 1M
????? ??? $15.000 / 1M $7.500 / 1M
আউটপুট টোকেন 2,222 1,988
রিজনিং টোকেন 68,503 0
প্রতিক্রিয়া সময় (গড়) 22.31s 1.30s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 100.41s 3.92s
প্রতিক্রিয়া সময় (মোট) 446.15s 25.95s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 242 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.2 6.7 83.3% 1 54.98s 412 19,995
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 576 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 171 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 15 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 120 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 72 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 314 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 222 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.0 10.0 0.0% 0 13.95s 30 1,821
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 13 0

দ্রুত তুলনা

তুলনার জুটি বদলান