নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs xAI: Grok 4.20

সারাংশ

MiniMax M2.5 vs Grok 4.20 benchmark তুলনা: MiniMax M2.5 average score-এ এগিয়ে: 4.7 vs 4.4. Grok 4.20-এর benchmark খরচ কম: $0.057 vs $0.164. Grok 4.20 দ্রুত: 1.11s vs 65.37s, pass rates 46.0% vs 28.6%.

প্রস্তাবিত মডেল: Grok 4.20 - Its score stays close to the best score here (4.4 vs 4.7), while costing about 2.9x less than MiniMax M2.5.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক MiniMax M2.5 MiniMax M2.5 medium প্রকাশ: 2026-02-12 Grok 4.20 Grok 4.20 none প্রকাশ: 2026-03-31
স্কোর 4.7 4.4
র‍্যাঙ্ক #151 #160
নির্ভরযোগ্যতা 10.0 প্রযোজ্য নয়
ধারাবাহিকতা 6.5 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 46.0% 28.6%
অস্থির টেস্ট 9 0
মোট রান 63 54
প্রতি ফলাফলে খরচ 7.900 1.570
মোট খরচ $0.164 $0.057
ইনপুট মূল্য $0.120 / 1M $1.250 / 1M
আউটপুট মূল্য $0.480 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 43,706 41,313
আউটপুট টোকেন 109,495 1,923
রিজনিং টোকেন 330,814 0
প্রতিক্রিয়া সময় (গড়) 65.37s 1.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 251.36s 6.04s
প্রতিক্রিয়া সময় (মোট) 849.76s 19.96s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 MiniMax M2.5

medium
অবৈধ SVG
খরচ
$0.000
সময়
300.0s
টোকেন
0 tok

#160 xAI: Grok 4.20

none
খরচ
$0.004
সময়
6.5s
টোকেন
1,367 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 612 286 45,344
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 3.4 9.1 0.0% 0 188.58s 6,076 357 106,177
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 21,104 740 9,713
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 6,584 266 3,835
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 308 105,047 133,487
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 492 25 1,686
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 7.5 10.0 50.0% 0 621ms 699 156 1,495
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 5.3 7.2 44.4% 1 11.21s 495 1,069 9,605
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 7,123 269 937
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 213 1,280 18,535
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান