#76

Qwen3.5-122B-A10B

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-04-11 01:44 qwen/qwen3.5-122b-a10b::none

(medium) (none)

সারাংশ

Qwen3.5-122B-A10B AI BENCHY-তে 5.7 স্কোর করে এবং #76 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 38.9%, মোট খরচ $0.022, এবং গড় response time 3.69s.

Qwen3.5-122B-A10B কে আলাদা করে যা: এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

স্কোর

5.7

ধারাবাহিকতা

9.2

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.022

মোট আউটপুট টোকেন

3,341

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.260 / 1M

আউটপুট মূল্য

$2.080 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 12

প্রতি চেষ্টায় পাস রেট: 38.9%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

3.69s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 46.00s

প্রতিক্রিয়া সময় (মোট): 66.50s

ভুল উত্তর: 11 নির্দেশনা অনুসরণ করা হয়নি: 1

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#76 Qwen3.5-122B-A10B

none

খরচ: $0.016
সময়: 44.5s
টোকেন: 6,431 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 13:26 নতুন টেস্ট যোগ হয়েছে	5.3	10.0	$0.020 ↓	তুলনা করুন
2026-05-21 23:57 স্যুইট পরিবর্তিত হয়েছে	5.4	10.0	$0.023	তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান	5.7	প্রযোজ্য নয়	$0.022	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-11 01:44 · প্রথম নথিভুক্ত রান	5.7	9.2	প্রযোজ্য নয়	6/18	2	3,341	$0.022	3.69s
2026-05-21 23:57 · স্যুইট পরিবর্তিত হয়েছে	5.4	9.2	10.0	6/20	2	3,375	$0.023	3.38s
পার্থক্য	+0.3	0.0		0	0	-34	-$0.002	+312ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.5-122B-A10BnonevsQwen3.5 Plus 2026-02-15none Qwen3.5-122B-A10BnonevsQwen3.5-27Bnone Qwen3.5-122B-A10BnonevsGemini 3.5 Flashhigh Qwen3.5-122B-A10BnonevsGemini 3 Flash Previewmedium Qwen3.5-122B-A10BnonevsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Qwen3.5-122B-A10BnonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	4.8	10.0
কোডিং	4.3	1.1
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	10.0
Sadharon Buddhimotta	5.0	10.0
নির্দেশনা অনুসরণ	4.5	6.8
ধাঁধা সমাধান	5.4	10.0
টুল কলিং	10.0	10.0

Qwen3.5-122B-A10B

Hamster playing table tennis

#76 Qwen3.5-122B-A10B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল