নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.7 Max vs StepFun: Step 3.7 Flash

সারাংশ

Qwen3.7 Max vs Step 3.7 Flash benchmark তুলনা: Step 3.7 Flash average score-এ এগিয়ে: 7.1 vs 6.9. Qwen3.7 Max-এর benchmark খরচ কম: $0.054 vs $1.148. Qwen3.7 Max দ্রুত: 1.30s vs 64.46s, pass rates 66.7% vs 63.5%.

প্রস্তাবিত মডেল: Qwen3.7 Max - Its score stays close to the best score here (6.9 vs 7.1), while costing about 21.3x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Qwen3.7 Max Qwen3.7 Max none প্রকাশ: 2026-05-22 Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 6.9 7.1
র‍্যাঙ্ক #69 #63
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 10.0 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 63.5%
অস্থির টেস্ট 0 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.744 10.434
মোট খরচ $0.054 $1.148
ইনপুট মূল্য $1.250 / 1M $0.200 / 1M
আউটপুট মূল্য $3.750 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 37,107 38,391
আউটপুট টোকেন 1,994 991,355
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 1.30s 64.46s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 3.92s 364.99s
প্রতিক্রিয়া সময় (মোট) 27.21s 1353.57s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#69 Qwen3.7 Max

none
Cost
$0.046
Time
195.0s
Tokens
12,171 tok

#63 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 696 242 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 5.5 10.0 33.3% 0 1.35s 7,911 582 0
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 9,549 171 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 7,794 243 0
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 789 15 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 522 120 0
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 711 72 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 714 314 0
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 8,211 222 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 210 13 0
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান