AI BENCHY
Advertise here
#125

Qwen3.5-122B-A10B

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-06-04 13:26 qwen/qwen3.5-122b-a10b::none
(medium) (none)

সারাংশ

Qwen3.5-122B-A10B AI BENCHY-তে 5.3 স্কোর করে এবং #125 স্থানে আছে। এর reliability 10.0, pass rate 31.8%, মোট খরচ $0.020, এবং গড় response time 3.41s.

Qwen3.5-122B-A10B কে আলাদা করে যা: এটি অ্যান্টি-এআই কৌশল-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #4; আর কোডিং এর দুর্বলতম ক্ষেত্র, rank #14.

ধারাবাহিকতা

9.6

মোট খরচ (বর্তমান মূল্য)

$0.020 ↓ -17.4%

পরীক্ষার সময়: $0.024

মোট আউটপুট টোকেন

3,383

মোট ইনপুট টোকেন

47,735

ইনপুট মূল্য

$0.260 / 1M

আউটপুট মূল্য

$2.080 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 15

প্রতি চেষ্টায় পাস রেট: 31.8%

অস্থির টেস্ট

1

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

3.41s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 46.00s

প্রতিক্রিয়া সময় (মোট): 71.59s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#125 Qwen3.5-122B-A10B

none
খরচ
$0.016
সময়
44.5s
টোকেন
6,431 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:26 নতুন টেস্ট যোগ হয়েছে 5.3 10.0 $0.020 বর্তমান রান
2026-05-21 23:57 স্যুইট পরিবর্তিত হয়েছে 5.4 10.0 $0.023 তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান 5.7 প্রযোজ্য নয় $0.022 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-06-04 13:26 · বর্তমান রান5.39.610.06/2113,38347,735$0.0203.41s
2026-05-21 23:57 · স্যুইট পরিবর্তিত হয়েছে5.49.210.06/2023,3750$0.0233.38s
পার্থক্য-0.1+0.40.00-1+8+47735-$0.004+27ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-04 15:40 $0.260 / 1M $2.080 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 4.8 10.0
কোডিং 3.7 7.0
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.3 10.0
Sadharon Buddhimotta 5.0 10.0
নির্দেশনা অনুসরণ 6.3 10.0
ধাঁধা সমাধান 3.8 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল