AI BENCHY
Advertise here
#75

MiMo-V2.5-Pro

Xiaomi প্রকাশ: 2026-04-22 পরীক্ষিত হয়েছে: 2026-04-22 21:39 xiaomi/mimo-v2.5-pro::none
(medium) (none)

সারাংশ

MiMo-V2.5-Pro AI BENCHY-তে 5.8 স্কোর করে এবং #75 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 46.3%, মোট খরচ $0.033, এবং গড় response time 1.51s.

MiMo-V2.5-Pro কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #3; আর অ্যান্টি-এআই কৌশল এর দুর্বলতম ক্ষেত্র, rank #14. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম। একই ধরনের মডেলের তুলনায় এটি লক্ষণীয়ভাবে দ্রুত।

ধারাবাহিকতা

8.3

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

2,451

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$1.000 / 1M

আউটপুট মূল্য

$3.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 12

প্রতি চেষ্টায় পাস রেট: 46.3%

অস্থির টেস্ট

4

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

1.51s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 3.54s

প্রতিক্রিয়া সময় (মোট): 27.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#75 MiMo-V2.5-Pro

none
Cost
$0.004
Time
46.4s
Tokens
4,025 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:48 নতুন টেস্ট যোগ হয়েছে 5.5 10.0 $0.017 তুলনা করুন
2026-05-08 15:29 স্যুইট পরিবর্তিত হয়েছে 5.7 10.0 $0.035 তুলনা করুন
2026-04-22 21:39 প্রথম নথিভুক্ত রান 5.8 প্রযোজ্য নয় $0.033 বর্তমান রান

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-04-22 21:39 · প্রথম নথিভুক্ত রান5.88.3প্রযোজ্য নয়6/1842,4510$0.0331.51s
2026-05-08 15:29 · স্যুইট পরিবর্তিত হয়েছে5.78.410.06/1943,0400$0.0351.88s
পার্থক্য+0.1-0.100-5890-$0.002-364ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 2.9 7.9
কোডিং 6.4 3.3
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.3 10.0
Sadharon Buddhimotta 4.5 10.0
নির্দেশনা অনুসরণ 6.4 10.0
ধাঁধা সমাধান 6.7 4.7
টুল কলিং 10.0 10.0

তুলনা করা মডেল