AI BENCHY
Advertise here

#41

Qwen3.5-122B-A10B

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-05-22 00:03 qwen/qwen3.5-122b-a10b::medium
(medium) (none)

ধারাবাহিকতা

8.8

মোট খরচ (বর্তমান মূল্য)

$0.509 ↓ -22.2%

পরীক্ষার সময়: $0.655

মোট আউটপুট টোকেন

239,690

ইনপুট মূল্য

$0.260 / 1M

আউটপুট মূল্য

$2.080 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 7

প্রতি চেষ্টায় পাস রেট: 71.7%

অস্থির টেস্ট

3

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

39.40s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 168.16s

প্রতিক্রিয়া সময় (মোট): 788.00s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-22 00:03 স্যুইট পরিবর্তিত হয়েছে 7.7 10.0 $0.650 বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান 8.1 প্রযোজ্য নয় $0.528 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-05-22 00:03 · বর্তমান রান7.78.810.013/203239,690$0.65539.40s
2026-04-11 01:44 · প্রথম নথিভুক্ত রান8.18.6প্রযোজ্য নয়13/183180,303$0.52831.38s
পার্থক্য-0.4+0.200+59387+$0.127+8020ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-05-28 17:57 $0.260 / 1M $2.080 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 10.0 10.0
কোডিং 4.1 5.8
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 2.9 7.2
Sadharon Buddhimotta 3.4 2.2
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 10.0 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল