নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

StepFun: Step 3.7 Flash vs Xiaomi: MiMo-V2.5

সারাংশ

Step 3.7 Flash vs MiMo-V2.5 benchmark তুলনা: MiMo-V2.5 average score-এ এগিয়ে: 7.3 vs 7.0. MiMo-V2.5-এর benchmark খরচ কম: $0.063 vs $1.148. MiMo-V2.5 দ্রুত: 27.11s vs 64.46s, pass rates 63.5% vs 69.8%.

প্রস্তাবিত মডেল: MiMo-V2.5 - It has the best score here (7.3), while costing about 18.4x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-04

মেট্রিক Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29 MiMo-V2.5 MiMo-V2.5 medium প্রকাশ: 2026-04-22
স্কোর 7.0 7.3
র‍্যাঙ্ক #71 #56
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.2 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 63.5% 69.8%
অস্থির টেস্ট 4 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 10.434 2.966
মোট খরচ $1.148 $0.063
ইনপুট মূল্য $0.200 / 1M $0.140 / 1M
আউটপুট মূল্য $1.150 / 1M $0.280 / 1M
মোট ইনপুট টোকেন 38,391 41,838
আউটপুট টোকেন 991,355 2,827
রিজনিং টোকেন 0 198,898
প্রতিক্রিয়া সময় (গড়) 64.46s 27.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 364.99s 162.44s
প্রতিক্রিয়া সময় (মোট) 1353.57s 569.38s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#71 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

#56 MiMo-V2.5

medium
Cost
$0.002
Time
54.8s
Tokens
5,247 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 621 281 1,739
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
MiMo-V2.5 6.2 4.7 66.7% 2 97.14s 7,422 557 81,977
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 15,060 363 7,609
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 7,746 306 5,714
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 735 507 49,478
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 492 121 418
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 672 88 801
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.25s 660 279 33,254
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 8,220 303 2,424
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 210 22 15,484

দ্রুত তুলনা

তুলনার জুটি বদলান