AI BENCHY
Advertise here
#45

Kimi K2.5

Moonshot AI প্রকাশ: 2026-01-27 পরীক্ষিত হয়েছে: 2026-06-04 13:43 moonshotai/kimi-k2.5::medium
(medium) (none)

সারাংশ

Kimi K2.5 AI BENCHY-তে 7.5 স্কোর করে এবং #45 স্থানে আছে। এর reliability 10.0, pass rate 68.3%, মোট খরচ $0.348, এবং গড় response time 98.43s.

Kimi K2.5 কে আলাদা করে যা: এটি Sadharon Buddhimotta-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #4; আর ধাঁধা সমাধান এর দুর্বলতম ক্ষেত্র, rank #15.

ধারাবাহিকতা

6.9

মোট খরচ (বর্তমান মূল্য)

$0.348 ↓ -6.2%

পরীক্ষার সময়: $0.371

মোট আউটপুট টোকেন

206,126

মোট ইনপুট টোকেন

34,312

ইনপুট মূল্য

$0.375 / 1M

আউটপুট মূল্য

$2.025 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 11

প্রতি চেষ্টায় পাস রেট: 68.3%

অস্থির টেস্ট

8

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

98.43s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 281.00s

প্রতিক্রিয়া সময় (মোট): 1378.03s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#45 MoonshotAI: Kimi K2.5

medium
খরচ
$0.030
সময়
58.6s
টোকেন
8,683 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:43 নতুন টেস্ট যোগ হয়েছে 6.8 10.0 $0.328 বর্তমান রান
2026-05-22 00:12 স্যুইট পরিবর্তিত হয়েছে 6.7 10.0 $0.314 তুলনা করুন
2026-04-20 17:48 প্রথম নথিভুক্ত রান 7.0 প্রযোজ্য নয় $0.220 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-06-04 13:43 · বর্তমান রান7.56.910.010/218206,12634,312$0.34898.43s
2026-04-20 17:48 · প্রথম নথিভুক্ত রান7.06.8প্রযোজ্য নয়9/187127,0460$0.22072.43s
পার্থক্য+0.5+0.1+1+1+79080+34312+$0.128+26003ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-04 15:40 $0.400 / 1M $1.900 / 1M
2026-06-17 10:07 $0.375 / 1M $2.025 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 7.3 5.8
কোডিং 6.1 4.6
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 3.5 4.4
Sadharon Buddhimotta 6.5 3.4
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 5.3 7.3
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল