AI BENCHY
Advertise here
#103

MiMo-V2-Flash

Xiaomi প্রকাশ: 2025-12-16 পরীক্ষিত হয়েছে: 2026-04-11 01:44 xiaomi/mimo-v2-flash::none
(medium) (none)

সারাংশ

MiMo-V2-Flash AI BENCHY-তে 4.5 স্কোর করে এবং #103 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 27.8%, মোট খরচ $0.023, এবং গড় response time 2.79s.

MiMo-V2-Flash কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ডেটা পার্সিং ও নিষ্কাশন এর দুর্বলতম ক্ষেত্র, rank #15.

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

ধারাবাহিকতা

7.8

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

68,522

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$0.090 / 1M

আউটপুট মূল্য

$0.290 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 15

প্রতি চেষ্টায় পাস রেট: 27.8%

অস্থির টেস্ট

5

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

2.79s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 19.68s

প্রতিক্রিয়া সময় (মোট): 39.08s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#103 MiMo-V2-Flash

none
খরচ
$0.001
সময়
7.7s
টোকেন
1,481 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:47 নতুন টেস্ট যোগ হয়েছে 4.6 6.7 $0.025 তুলনা করুন
2026-05-22 00:20 স্যুইট পরিবর্তিত হয়েছে 4.4 10.0 $0.024 তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান 4.5 প্রযোজ্য নয় $0.023 বর্তমান রান

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-04-11 01:44 · প্রথম নথিভুক্ত রান4.57.8প্রযোজ্য নয়3/18568,5220$0.0232.79s
2026-06-04 13:47 · নতুন টেস্ট যোগ হয়েছে4.68.56.74/21468,88236,851$0.0252.76s
পার্থক্য-0.1-0.7-1+1-360-36851-$0.002+28ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 3.2 8.0
কোডিং 6.3 3.7
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 2.9 5.8
ডোমেইন-নির্দিষ্ট 5.3 7.2
Sadharon Buddhimotta 4.6 10.0
নির্দেশনা অনুসরণ 6.5 10.0
ধাঁধা সমাধান 3.6 7.2
টুল কলিং 10.0 10.0

তুলনা করা মডেল