নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium প্রকাশ: 2026-02-15 Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29
স্কোর 8.1 7.4
র‍্যাঙ্ক #23 #60
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 8.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 76.7% 68.3%
অস্থির টেস্ট 3 3
মোট রান 60 60
প্রতি ফলাফলে খরচ 2.251 2.796
মোট খরচ $0.316 $0.336
ইনপুট মূল্য $0.260 / 1M $0.200 / 1M
আউটপুট মূল্য $1.560 / 1M $1.150 / 1M
আউটপুট টোকেন 2,145 285,209
রিজনিং টোকেন 172,563 0
প্রতিক্রিয়া সময় (গড়) 67.58s 16.06s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 266.69s 124.75s
প্রতিক্রিয়া সময় (মোট) 878.57s 321.11s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 205 21,236
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 7.6 6.7 66.7% 1 193.80s 406 63,554
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 270 14,916
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 35 16,680
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 73 8,675
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 301 13,853
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 24 17,130
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

দ্রুত তুলনা

তুলনার জুটি বদলান