নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MiniMax: MiniMax M3 vs MoonshotAI: Kimi K2.5

সারাংশ

MiniMax M3 vs Kimi K2.5 benchmark তুলনা: MiniMax M3 average score-এ এগিয়ে: 7.6 vs 7.5. MiniMax M3-এর benchmark খরচ কম: $0.131 vs $0.348. MiniMax M3 দ্রুত: 68.17s vs 98.43s, pass rates 65.1% vs 68.3%.

প্রস্তাবিত মডেল: MiniMax M3 - It has the best score here (7.6), while costing about 2.7x less than Kimi K2.5.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক MiniMax M3 MiniMax M3 medium প্রকাশ: 2026-06-01 Kimi K2.5 Kimi K2.5 medium প্রকাশ: 2026-01-27
স্কোর 7.6 7.5
র‍্যাঙ্ক #42 #45
নির্ভরযোগ্যতা 9.6 10.0
ধারাবাহিকতা 7.9 6.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 65.1% 68.3%
অস্থির টেস্ট 5 8
মোট রান 63 63
প্রতি ফলাফলে খরচ 1.187 3.704
মোট খরচ $0.131 $0.348
ইনপুট মূল্য $0.300 / 1M $0.375 / 1M
আউটপুট মূল্য $1.200 / 1M $2.025 / 1M
মোট ইনপুট টোকেন 46,546 34,312
আউটপুট টোকেন 49,036 48,379
রিজনিং টোকেন 92,543 157,747
প্রতিক্রিয়া সময় (গড়) 68.17s 98.43s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 431.03s 281.00s
প্রতিক্রিয়া সময় (মোট) 1363.38s 1378.03s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#42 MiniMax M3

medium
খরচ
$0.012
সময়
154.4s
টোকেন
10,018 tok

#45 MoonshotAI: Kimi K2.5

medium
খরচ
$0.030
সময়
58.6s
টোকেন
8,683 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 5.5 3.7 66.7% 3 14.95s 2,526 874 3,414
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 634 2,789 8,880
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 6.1 6.5 55.6% 1 144.74s 5,804 6,223 32,667
Kimi K2.5 6.1 4.6 66.7% 2 217.49s 6,935 5,705 74,693
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 10.0 10.0 100.0% 0 65.30s 14,760 1,306 6,253
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 11,280 703 3,713
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 10.0 10.0 100.0% 0 14.92s 8,088 514 3,164
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 7,020 563 7,940
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 5.5 9.3 33.3% 0 233.13s 869 16,254 19,070
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 485 20,753 30,564
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 5.1 3.4 33.3% 1 33.25s 954 2,487 2,523
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 480 3,815 4,262
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 9.8 10.0 100.0% 0 6.14s 1,623 103 920
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 675 5,371 6,547
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 7.9 9.9 66.7% 0 49.91s 2,079 11,946 13,761
Kimi K2.5 5.3 7.3 44.4% 1 43.23s 659 8,426 12,692
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 10.0 10.0 100.0% 0 11.91s 9,168 281 555
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 5,933 242 812
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M3 3.0 10.0 0.0% 0 100.80s 675 9,048 10,216
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 211 12 7,644

দ্রুত তুলনা

তুলনার জুটি বদলান