AI BENCHY
Advertise here
#124

Qwen3.5-122B-A10B

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-05-21 23:57 qwen/qwen3.5-122b-a10b::none
(medium) (none)

সারাংশ

Qwen3.5-122B-A10B AI BENCHY-তে 5.4 স্কোর করে এবং #124 স্থানে আছে। এর reliability 10.0, pass rate 35.0%, মোট খরচ $0.023, এবং গড় response time 3.38s.

ধারাবাহিকতা

9.2

মোট আউটপুট টোকেন

3,375

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$0.260 / 1M

আউটপুট মূল্য

$2.080 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 14

প্রতি চেষ্টায় পাস রেট: 35.0%

অস্থির টেস্ট

2

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

3.38s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 46.00s

প্রতিক্রিয়া সময় (মোট): 67.64s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#124 Qwen3.5-122B-A10B

none
খরচ
$0.016
সময়
44.5s
টোকেন
6,431 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:26 নতুন টেস্ট যোগ হয়েছে 5.3 10.0 $0.020 তুলনা করুন
2026-05-21 23:57 স্যুইট পরিবর্তিত হয়েছে 5.4 10.0 $0.023 বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান 5.7 প্রযোজ্য নয় $0.022 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-05-21 23:57 · স্যুইট পরিবর্তিত হয়েছে5.49.210.06/2023,3750$0.0233.38s
2026-06-04 13:26 · নতুন টেস্ট যোগ হয়েছে5.39.610.06/2113,38347,735$0.0203.41s
পার্থক্য+0.1-0.40.00+1-8-47735+$0.004-27ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 4.8 10.0
কোডিং 4.0 5.5
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.3 10.0
Sadharon Buddhimotta 5.0 10.0
নির্দেশনা অনুসরণ 6.3 10.0
ধাঁধা সমাধান 3.7 7.7
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল