AI BENCHY
Advertise here
#132

Qwen3.5-122B-A10B

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-06-04 13:26 qwen/qwen3.5-122b-a10b::none
(medium) (none)

সারাংশ

Qwen3.5-122B-A10B AI BENCHY-তে 5.3 স্কোর করে এবং #132 স্থানে আছে। এর reliability 10.0, pass rate 31.8%, মোট খরচ $0.020, এবং গড় response time 3.41s.

Qwen3.5-122B-A10B কে আলাদা করে যা: এটি Sadharon Buddhimotta-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #3; আর কোডিং এর দুর্বলতম ক্ষেত্র, rank #13.

ধারাবাহিকতা

9.6

মোট খরচ (বর্তমান মূল্য)

$0.020 ↓ -17.4%

পরীক্ষার সময়: $0.024

মোট আউটপুট টোকেন

3,383

মোট ইনপুট টোকেন

47,735

ইনপুট মূল্য

$0.260 / 1M

আউটপুট মূল্য

$2.080 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 15

প্রতি চেষ্টায় পাস রেট: 31.8%

অস্থির টেস্ট

1

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

3.41s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 46.00s

প্রতিক্রিয়া সময় (মোট): 71.59s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#132 Qwen3.5-122B-A10B

none
Cost
$0.016
Time
44.5s
Tokens
6,431 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:26 নতুন টেস্ট যোগ হয়েছে 5.3 10.0 $0.020 বর্তমান রান
2026-05-21 23:57 স্যুইট পরিবর্তিত হয়েছে 5.4 10.0 $0.023 তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান 5.7 প্রযোজ্য নয় $0.022 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-04 15:40 $0.260 / 1M $2.080 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 4.8 10.0
কোডিং 3.7 7.0
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.3 10.0
Sadharon Buddhimotta 5.0 10.0
নির্দেশনা অনুসরণ 6.3 10.0
ধাঁধা সমাধান 3.8 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল