নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs StepFun: Step 3.5 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-10

মেট্রিক Qwen3.6 Max Preview Qwen3.6 Max Preview none প্রকাশ: 2026-04-20 Step 3.5 Flash Step 3.5 Flash medium প্রকাশ: 2026-02-01
স্কোর 7.2 7.6
র‍্যাঙ্ক #54 #43
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.1 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 64.9% 66.7%
অস্থির টেস্ট 2 2
মোট রান 57 54
প্রতি ফলাফলে খরচ 0.755 0.099
মোট খরচ $0.083 $0.011
???? ??? $1.040 / 1M $0.100 / 1M
????? ??? $6.240 / 1M $0.300 / 1M
আউটপুট টোকেন 4,751 78,299
রিজনিং টোকেন 0 173,409
প্রতিক্রিয়া সময় (গড়) 3.31s 41.66s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 20.51s 170.45s
প্রতিক্রিয়া সময় (মোট) 62.80s 499.91s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 20,391 24,176
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
Step 3.5 Flash - - - - - - - -
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 240 3,506
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.45s 69 0
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 19 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 2,354 10,372

দ্রুত তুলনা

তুলনার জুটি বদলান