AI BENCHY
Advertise here
#87

MiniMax M2.7

Minimax প্রকাশ: 2026-03-18 পরীক্ষিত হয়েছে: 2026-04-11 01:44 minimax/minimax-m2.7::medium

সারাংশ

MiniMax M2.7 AI BENCHY-তে 5.3 স্কোর করে এবং #87 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 51.9%, মোট খরচ $0.091, এবং গড় response time 31.08s.

MiniMax M2.7 কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর নির্দেশনা অনুসরণ এর দুর্বলতম ক্ষেত্র, rank #14.

ধারাবাহিকতা

5.5

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

67,771

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$0.300 / 1M

আউটপুট মূল্য

$1.200 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 14

প্রতি চেষ্টায় পাস রেট: 51.9%

অস্থির টেস্ট

10

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

31.08s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 117.04s

প্রতিক্রিয়া সময় (মোট): 528.37s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#87 MiniMax M2.7

medium
খরচ
$0.022
সময়
22.8s
টোকেন
9,250 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:26 নতুন টেস্ট যোগ হয়েছে 5.3 7.8 $0.124 তুলনা করুন
2026-05-21 23:52 স্যুইট পরিবর্তিত হয়েছে 5.0 8.3 $0.104 তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান 5.3 প্রযোজ্য নয় $0.091 বর্তমান রান

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-04-11 01:44 · প্রথম নথিভুক্ত রান5.35.5প্রযোজ্য নয়4/181067,7710$0.09131.08s
2026-06-04 13:26 · নতুন টেস্ট যোগ হয়েছে5.36.57.85/21998,79334,371$0.12438.18s
পার্থক্য0.0-1.0-1+1-31022-34371-$0.034-7100ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 7.9 6.3
কোডিং 10.0 10.0
সমন্বিত 4.7 1.6
ডেটা পার্সিং ও নিষ্কাশন 6.3 5.8
ডোমেইন-নির্দিষ্ট 3.0 10.0
Sadharon Buddhimotta 3.9 2.5
নির্দেশনা অনুসরণ 3.7 1.8
ধাঁধা সমাধান 3.8 4.5
টুল কলিং 4.7 1.6

তুলনা করা মডেল