AI BENCHY
Advertise here
#143

MiMo-V2.5

Xiaomi প্রকাশ: 2026-04-22 পরীক্ষিত হয়েছে: 2026-06-04 13:48 xiaomi/mimo-v2.5::none
(medium) (none)

সারাংশ

MiMo-V2.5 AI BENCHY-তে 4.9 স্কোর করে এবং #143 স্থানে আছে। এর reliability 10.0, pass rate 27.0%, মোট খরচ $0.007, এবং গড় response time 2.20s.

MiMo-V2.5 কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ডোমেইন-নির্দিষ্ট এর দুর্বলতম ক্ষেত্র, rank #9.

ধারাবাহিকতা

9.6

মোট খরচ (বর্তমান মূল্য)

$0.007 ↓ -68.4%

পরীক্ষার সময়: $0.021

মোট আউটপুট টোকেন

2,267

মোট ইনপুট টোকেন

41,985

ইনপুট মূল্য

$0.140 / 1M

আউটপুট মূল্য

$0.280 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 16

প্রতি চেষ্টায় পাস রেট: 27.0%

অস্থির টেস্ট

1

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

2.20s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 6.86s

প্রতিক্রিয়া সময় (মোট): 46.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#143 MiMo-V2.5

none
Cost
$0.007
Time
267.4s
Tokens
25,283 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:48 নতুন টেস্ট যোগ হয়েছে 4.9 10.0 $0.007 বর্তমান রান
2026-05-22 12:51 নতুন টেস্ট যোগ হয়েছে 4.8 10.0 $0.021 তুলনা করুন
2026-05-08 15:33 স্যুইট পরিবর্তিত হয়েছে 4.9 10.0 $0.019 তুলনা করুন
2026-04-22 21:39 প্রথম নথিভুক্ত রান 5.1 প্রযোজ্য নয় $0.019 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-06-04 13:48 · বর্তমান রান4.99.610.05/2112,26741,985$0.0072.20s
2026-05-22 12:51 · নতুন টেস্ট যোগ হয়েছে4.89.310.04/2022,2580$0.0212.20s
পার্থক্য+0.1+0.30.0+1-1+9+41985-$0.014+2ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-04 15:40 $0.140 / 1M $0.280 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 3.5 8.0
কোডিং 5.5 10.0
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 6.5 10.0
ডোমেইন-নির্দিষ্ট 3.0 10.0
Sadharon Buddhimotta 4.4 9.9
নির্দেশনা অনুসরণ 6.5 10.0
ধাঁধা সমাধান 5.4 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল