AI BENCHY
Advertise here

#26

MiMo-V2-Pro

Xiaomi প্রকাশ: 2026-03-18 পরীক্ষিত হয়েছে: 2026-04-11 01:44 xiaomi/mimo-v2-pro::medium
(medium) (none)

পরিচয় নোট

Hunter Alpha ছিল MiMo-V2-Pro-এর স্টেলথ সংস্করণ।

ধারাবাহিকতা

8.6

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

40,680

ইনপুট মূল্য

$1.000 / 1M

আউটপুট মূল্য

$3.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 6

প্রতি চেষ্টায় পাস রেট: 77.8%

অস্থির টেস্ট

3

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

12.27s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 64.71s

প্রতিক্রিয়া সময় (মোট): 208.56s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-22 00:25 স্যুইট পরিবর্তিত হয়েছে 7.6 9.5 $0.295 তুলনা করুন
2026-05-08 15:32 স্যুইট পরিবর্তিত হয়েছে 7.7 9.4 $0.212 তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান 8.1 প্রযোজ্য নয় $0.159 বর্তমান রান

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-04-11 01:44 · প্রথম নথিভুক্ত রান8.18.6প্রযোজ্য নয়12/18340,680$0.15912.27s
2026-05-22 00:25 · স্যুইট পরিবর্তিত হয়েছে7.67.99.512/20584,435$0.29522.19s
পার্থক্য+0.5+0.70-2-43755-$0.136-9920ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 10.0 10.0
কোডিং 10.0 10.0
সমন্বিত 4.7 1.6
ডেটা পার্সিং ও নিষ্কাশন 7.3 5.8
ডোমেইন-নির্দিষ্ট 5.3 10.0
Sadharon Buddhimotta 10.0 10.0
নির্দেশনা অনুসরণ 9.9 10.0
ধাঁধা সমাধান 7.0 7.2
টুল কলিং 10.0 10.0

তুলনা করা মডেল