AI BENCHY
Advertise here
#77

MiniMax M2.5

Minimax প্রকাশ: 2026-02-12 পরীক্ষিত হয়েছে: 2026-04-20 17:48 minimax/minimax-m2.5::medium

সারাংশ

MiniMax M2.5 AI BENCHY-তে 5.7 স্কোর করে এবং #77 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 57.4%, মোট খরচ $0.250, এবং গড় response time 39.65s.

MiniMax M2.5 কে আলাদা করে যা: এটি অস্বাভাবিকভাবে বেশি reasoning tokens ব্যবহার করে, যা ধীর বা বেশি খরচের runs ব্যাখ্যা করতে পারে।

ধারাবাহিকতা

5.6

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

313,466

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$0.150 / 1M

আউটপুট মূল্য

$1.200 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 13

প্রতি চেষ্টায় পাস রেট: 57.4%

অস্থির টেস্ট

10

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

39.65s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 237.27s

প্রতিক্রিয়া সময় (মোট): 396.47s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#77 MiniMax M2.5

medium
অবৈধ SVG
খরচ
$0.000
সময়
300.0s
টোকেন
0 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:23 নতুন টেস্ট যোগ হয়েছে 5.3 8.9 $0.385 তুলনা করুন
2026-05-21 23:48 স্যুইট পরিবর্তিত হয়েছে 5.4 8.3 $0.305 তুলনা করুন
2026-04-20 17:48 প্রথম নথিভুক্ত রান 5.7 প্রযোজ্য নয় $0.250 বর্তমান রান

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-04-20 17:48 · প্রথম নথিভুক্ত রান5.75.6প্রযোজ্য নয়5/1810313,4660$0.25039.65s
2026-06-04 13:23 · নতুন টেস্ট যোগ হয়েছে5.36.28.95/2110440,30943,706$0.38565.37s
পার্থক্য+0.4-0.600-126843-43706-$0.136-25719ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 7.9 6.3
কোডিং 3.0 10.0
সমন্বিত 4.5 2.1
ডেটা পার্সিং ও নিষ্কাশন 4.6 1.7
ডোমেইন-নির্দিষ্ট 2.9 4.4
Sadharon Buddhimotta 3.8 2.5
নির্দেশনা অনুসরণ 8.1 6.8
ধাঁধা সমাধান 5.3 7.2
টুল কলিং 10.0 10.0

তুলনা করা মডেল