নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs Qwen: Qwen3.7 Max

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-22

মেট্রিক Qwen3.6 Max Preview Qwen3.6 Max Preview medium প্রকাশ: 2026-04-20 Qwen3.7 Max Qwen3.7 Max medium প্রকাশ: 2026-05-22
স্কোর 8.4 9.0
র‍্যাঙ্ক #14 #5
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 9.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 80.0% 88.3%
অস্থির টেস্ট 2 1
মোট রান 60 60
প্রতি ফলাফলে খরচ 6.906 5.540
মোট খরচ $1.036 $0.942
???? ??? $1.040 / 1M $2.500 / 1M
????? ??? $6.240 / 1M $7.500 / 1M
আউটপুট টোকেন 2,225 2,109
রিজনিং টোকেন 130,808 110,285
প্রতিক্রিয়া সময় (গড়) 58.41s 13.83s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 238.07s 33.37s
প্রতিক্রিয়া সময় (মোট) 1168.27s 276.53s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 228 10,075
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 222 8,742
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 8.2 6.7 83.3% 1 177.97s 407 39,442
Qwen3.7 Max 10.0 10.0 100.0% 0 22.98s 403 22,134
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 390 14,575
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 366 8,405
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 270 10,106
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 270 6,254
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 60 30,371
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 61 31,793
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 129 3,510
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 135 4,457
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 103 5,848
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 102 5,452
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.19s 301 7,649
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 259 8,908
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 309 1,571
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 267 1,220
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 60.56s 28 7,661
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 24 12,920

দ্রুত তুলনা

তুলনার জুটি বদলান