নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 Flash vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-04

মেট্রিক Qwen3.6 Flash Qwen3.6 Flash medium প্রকাশ: 2026-04-20 Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29
স্কোর 7.5 7.3
র‍্যাঙ্ক #39 #57
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.1 8.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 71.4% 68.3%
অস্থির টেস্ট 5 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 3.030 2.840
মোট খরচ $0.288 $0.341
ইনপুট মূল্য $0.188 / 1M $0.200 / 1M
আউটপুট মূল্য $1.125 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 42,362 40,101
আউটপুট টোকেন 2,995 289,325
রিজনিং টোকেন 245,358 0
প্রতিক্রিয়া সময় (গড়) 19.25s 15.74s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 122.87s 124.75s
প্রতিক্রিয়া সময় (মোট) 404.20s 330.63s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 672 624 14,024
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 5.0 5.1 44.5% 2 42.85s 7,895 495 67,967
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 14,934 483 13,839
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 7,782 270 13,155
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 771 60 24,409
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 516 140 5,445
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 699 102 7,423
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 696 460 10,860
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 8,193 335 1,188
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 204 26 87,048
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

দ্রুত তুলনা

তুলনার জুটি বদলান