#108

MiMo-V2.5-Pro

Xiaomi প্রকাশ: 2026-04-22 পরীক্ষিত হয়েছে: 2026-05-08 15:29 xiaomi/mimo-v2.5-pro::none

(medium) (none)

সারাংশ

MiMo-V2.5-Pro AI BENCHY-তে 5.7 স্কোর করে এবং #108 স্থানে আছে। এর reliability 10.0, pass rate 43.9%, মোট খরচ $0.035, এবং গড় response time 1.88s.

MiMo-V2.5-Pro কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #3; আর অ্যান্টি-এআই কৌশল এর দুর্বলতম ক্ষেত্র, rank #16. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম। একই ধরনের মডেলের তুলনায় এটি লক্ষণীয়ভাবে দ্রুত।

স্কোর

5.7

ধারাবাহিকতা

8.4

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.035

মোট আউটপুট টোকেন

3,040

মোট ইনপুট টোকেন

ইনপুট মূল্য

$1.000 / 1M

আউটপুট মূল্য

$3.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 13

প্রতি চেষ্টায় পাস রেট: 43.9%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

1.88s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 8.32s

প্রতিক্রিয়া সময় (মোট): 35.63s

ভুল উত্তর: 10 নির্দেশনা অনুসরণ করা হয়নি: 3

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#108 MiMo-V2.5-Pro

none

খরচ: $0.004
সময়: 46.4s
টোকেন: 4,025 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:42 নতুন টেস্ট যোগ হয়েছে	5.5	10.0	$0.068 ↓	তুলনা করুন
2026-06-04 13:48 নতুন টেস্ট যোগ হয়েছে	5.5	10.0	$0.017 ↓	তুলনা করুন
2026-05-08 15:29 স্যুইট পরিবর্তিত হয়েছে	5.7	10.0	$0.035	বর্তমান রান
2026-04-22 21:39 প্রথম নথিভুক্ত রান	5.8	প্রযোজ্য নয়	$0.033	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

MiMo-V2.5-PrononevsNorth Mini Codemediumবিনামূল্যে উপলভ্য MiMo-V2.5-PrononevsGPT-5.4none MiMo-V2.5-PrononevsGPT-5.4 Mininone MiMo-V2.5-PrononevsNemotron 3 Supermediumবিনামূল্যে উপলভ্য MiMo-V2.5-PrononevsGLM 5none MiMo-V2.5-PrononevsGemini 3.6 Flashmedium MiMo-V2.5-PrononevsGemini 3.6 Flashhigh MiMo-V2.5-PrononevsNemotron 3 Ultramediumবিনামূল্যে উপলভ্য MiMo-V2.5-PrononevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	3.3	8.1
কোডিং	6.4	3.3
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	10.0
Sadharon Buddhimotta	4.0	10.0
নির্দেশনা অনুসরণ	6.4	10.0
ধাঁধা সমাধান	6.7	4.7
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

MiMo-V2.5-Pro

Hamster playing table tennis

#108 MiMo-V2.5-Pro

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল