নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs Xiaomi: MiMo-V2.5

সারাংশ

Qwen3.6 Max Preview vs MiMo-V2.5 benchmark তুলনা: MiMo-V2.5 average score-এ এগিয়ে: 6.7 vs 6.0. MiMo-V2.5-এর benchmark খরচ কম: $0.063 vs $0.075. Qwen3.6 Max Preview দ্রুত: 3.30s vs 27.11s, pass rates 58.7% vs 69.8%.

প্রস্তাবিত মডেল: Qwen3.6 Max Preview - Its score stays close to the best score here (6.0 vs 6.7), while responding about 8.2x faster than MiMo-V2.5.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Qwen3.6 Max Preview Qwen3.6 Max Preview none প্রকাশ: 2026-04-20 MiMo-V2.5 MiMo-V2.5 medium প্রকাশ: 2026-04-22
স্কোর 6.0 6.7
র‍্যাঙ্ক #100 #76
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 58.7% 69.8%
অস্থির টেস্ট 2 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.824 2.966
মোট খরচ $0.075 $0.063
ইনপুট মূল্য $1.040 / 1M $0.140 / 1M
আউটপুট মূল্য $6.240 / 1M $0.280 / 1M
মোট ইনপুট টোকেন 42,509 41,838
আউটপুট টোকেন 4,779 2,827
রিজনিং টোকেন 0 198,898
প্রতিক্রিয়া সময় (গড়) 3.30s 27.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 20.51s 162.44s
প্রতিক্রিয়া সময় (মোট) 69.40s 569.38s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#100 Qwen3.6 Max Preview

none
খরচ
$0.025
সময়
83.9s
টোকেন
4,066 tok

#76 MiMo-V2.5

medium
খরচ
$0.002
সময়
54.8s
টোকেন
5,247 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 621 281 1,739
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
MiMo-V2.5 6.2 4.7 66.7% 2 97.14s 7,422 557 81,977
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 15,060 363 7,609
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 7,746 306 5,714
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 735 507 49,478
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 492 121 418
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 672 88 801
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.25s 660 279 33,254
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 8,220 303 2,424
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 210 22 15,484

দ্রুত তুলনা

তুলনার জুটি বদলান