নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs StepFun: Step 3.7 Flash

সারাংশ

Qwen3.5 Plus 2026-02-15 vs Step 3.7 Flash benchmark তুলনা: Step 3.7 Flash average score-এ এগিয়ে: 7.1 vs 5.8. Qwen3.5 Plus 2026-02-15-এর benchmark খরচ কম: $0.016 vs $1.148. Qwen3.5 Plus 2026-02-15 দ্রুত: 2.31s vs 64.46s, pass rates 46.0% vs 63.5%.

প্রস্তাবিত মডেল: Qwen3.5 Plus 2026-02-15 - It offers the best overall trade-off: a competitive score (5.8), lower cost than Step 3.7 Flash, and balanced response time.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none প্রকাশ: 2026-02-15 Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 5.8 7.1
র‍্যাঙ্ক #106 #63
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.4 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 46.0% 63.5%
অস্থির টেস্ট 2 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.204 10.434
মোট খরচ $0.016 $1.148
ইনপুট মূল্য $0.260 / 1M $0.200 / 1M
আউটপুট মূল্য $1.560 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 45,864 38,391
আউটপুট টোকেন 2,480 991,355
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 2.31s 64.46s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.65s 364.99s
প্রতিক্রিয়া সময় (মোট) 34.63s 1353.57s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#106 Qwen3.5 Plus 2026-02-15

none
খরচ
$0.012
সময়
153.2s
টোকেন
7,787 tok

#63 Step 3.7 Flash

high
খরচ
$0.007
সময়
63.6s
টোকেন
6,030 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 696 517 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 4.3 7.9 11.1% 1 2.05s 7,913 473 0
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 18,304 314 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 7,794 243 0
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 789 17 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 522 117 0
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 711 72 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.71s 714 494 0
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 8,211 222 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 1.11s 210 11 0
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান