নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.6 35B A3B vs Xiaomi: MiMo-V2.5

সারাংশ

Qwen3.6 35B A3B vs MiMo-V2.5 benchmark তুলনা: Qwen3.6 35B A3B average score-এ এগিয়ে: 7.4 vs 7.3. MiMo-V2.5-এর benchmark খরচ কম: $0.063 vs $0.146. Qwen3.6 35B A3B দ্রুত: 18.08s vs 27.11s, pass rates 63.5% vs 69.8%.

প্রস্তাবিত মডেল: MiMo-V2.5 - Its score stays close to the best score here (7.3 vs 7.4), while costing about 2.3x less than Qwen3.6 35B A3B.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-04

মেট্রিক Qwen3.6 35B A3B Qwen3.6 35B A3B medium প্রকাশ: 2026-04-20 MiMo-V2.5 MiMo-V2.5 medium প্রকাশ: 2026-04-22
স্কোর 7.4 7.3
র‍্যাঙ্ক #46 #56
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.6 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 63.5% 69.8%
অস্থির টেস্ট 1 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 1.094 2.966
মোট খরচ $0.146 $0.063
ইনপুট মূল্য $0.140 / 1M $0.140 / 1M
আউটপুট মূল্য $1.000 / 1M $0.280 / 1M
মোট ইনপুট টোকেন 16,385 41,838
আউটপুট টোকেন 19,632 2,827
রিজনিং টোকেন 130,219 198,898
প্রতিক্রিয়া সময় (গড়) 18.08s 27.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 86.11s 162.44s
প্রতিক্রিয়া সময় (মোট) 343.61s 569.38s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#46 Qwen3.6 35B A3B

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#56 MiMo-V2.5

medium
Cost
$0.002
Time
54.8s
Tokens
5,247 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 672 1,154 12,385
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 621 281 1,739
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 7.7 10.0 66.7% 0 50.55s 5,051 7,929 37,223
MiMo-V2.5 6.2 4.7 66.7% 2 97.14s 7,422 557 81,977
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 15,060 363 7,609
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 7,776 2,591 9,968
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 7,746 306 5,714
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 771 6,193 39,116
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 735 507 49,478
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 516 129 4,569
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 492 121 418
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 699 219 7,404
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 672 88 801
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 8.0 10.0 66.7% 0 5.95s 696 655 9,228
MiMo-V2.5 8.2 7.2 88.9% 1 20.25s 660 279 33,254
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 8,220 303 2,424
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 204 762 10,326
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 210 22 15,484

দ্রুত তুলনা

তুলনার জুটি বদলান