নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs StepFun: Step 3.7 Flash

সারাংশ

Qwen3.5 Plus 2026-02-15 vs Step 3.7 Flash benchmark তুলনা: Qwen3.5 Plus 2026-02-15 average score-এ এগিয়ে: 8.0 vs 7.1. Qwen3.5 Plus 2026-02-15-এর benchmark খরচ কম: $0.310 vs $1.148. Step 3.7 Flash দ্রুত: 64.46s vs 73.79s, pass rates 73.0% vs 63.5%.

প্রস্তাবিত মডেল: Qwen3.5 Plus 2026-02-15 - It has the best score here (8.0), while costing about 3.7x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium প্রকাশ: 2026-02-15 Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 8.0 7.1
র‍্যাঙ্ক #28 #63
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 73.0% 63.5%
অস্থির টেস্ট 3 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.445 10.434
মোট খরচ $0.310 $1.148
ইনপুট মূল্য $0.260 / 1M $0.200 / 1M
আউটপুট মূল্য $1.560 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 40,918 38,391
আউটপুট টোকেন 2,159 991,355
রিজনিং টোকেন 189,604 0
প্রতিক্রিয়া সময় (গড়) 73.79s 64.46s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 266.69s 364.99s
প্রতিক্রিয়া সময় (মোট) 1033.07s 1353.57s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#28 Qwen3.5 Plus 2026-02-15

medium
খরচ
$0.011
সময়
125.5s
টোকেন
7,040 tok

#63 Step 3.7 Flash

high
খরচ
$0.007
সময়
63.6s
টোকেন
6,030 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 672 205 21,236
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 6.6 7.1 44.4% 1 180.70s 6,950 420 80,595
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 14,934 421 7,906
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 7,782 270 14,916
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 444 35 16,680
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 344 73 8,675
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 699 101 7,704
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 696 301 13,853
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 8,193 309 909
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 204 24 17,130
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান