নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs StepFun: Step 3.5 Flash

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক Qwen: Qwen3.5 Plus 2026-02-15 none প্রকাশ: 2026-02-15 StepFun: Step 3.5 Flash medium প্রকাশ: 2026-02-01 বিনামূল্যে উপলভ্য
র‍্যাঙ্ক #29 #13
গড় স্কোর 6.2 7.4
ধারাবাহিকতা 9.6 9.1
প্রতি ফলাফলে খরচ 0.172 0.000
মোট খরচ $0.016 $0.000
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 58.3% 68.8%
অস্থির টেস্ট 1 2
মোট রান 48 48
আউটপুট টোকেন 2,015 71,452
রিজনিং টোকেন 0 155,147
প্রতিক্রিয়া সময় (গড়) 2.65s 29.10s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.65s 170.45s
প্রতিক্রিয়া সময় (মোট) 26.52s 290.96s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 2.74s 514 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5 Plus 2026-02-15 10.0 10.0 0.0% 0 6.65s 314 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5 Plus 2026-02-15 9.9 10.0 100.0% 0 1.89s 243 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 1.17s 17 0
StepFun: Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5 Plus 2026-02-15 4.0 3.0 33.3% 1 2.26s 117 0
StepFun: Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
StepFun: Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5 Plus 2026-02-15 7.0 10.0 66.7% 0 2.82s 516 0
StepFun: Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen: Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

দ্রুত তুলনা

তুলনার জুটি বদলান