নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs StepFun: Step 3.5 Flash

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক Qwen: Qwen3.5-Flash none প্রকাশ: 2026-02-24 StepFun: Step 3.5 Flash medium প্রকাশ: 2026-02-01 বিনামূল্যে উপলভ্য
র‍্যাঙ্ক #37 #13
গড় স্কোর 5.2 7.4
ধারাবাহিকতা 9.6 9.1
প্রতি ফলাফলে খরচ 0.077 0.000
মোট খরচ $0.006 $0.000
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 45.8% 68.8%
অস্থির টেস্ট 1 2
মোট রান 48 48
আউটপুট টোকেন 3,774 71,452
রিজনিং টোকেন 0 155,147
প্রতিক্রিয়া সময় (গড়) 3.54s 29.10s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 13.73s 170.45s
প্রতিক্রিয়া সময় (মোট) 56.70s 290.96s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5-Flash 2.3 7.8 11.1% 1 1.62s 687 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5-Flash 10.0 10.0 0.0% 0 6.22s 1,794 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5-Flash 9.9 10.0 100.0% 0 1.57s 243 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5-Flash 7.0 10.0 66.7% 0 905ms 15 0
StepFun: Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
StepFun: Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5-Flash 5.0 10.0 50.0% 0 8.81s 63 0
StepFun: Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5-Flash 1.3 10.0 0.0% 0 5.90s 608 0
StepFun: Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

দ্রুত তুলনা

তুলনার জুটি বদলান