AI BENCHY
Advertise here
#14

Qwen3.6 Max Preview

Qwen প্রকাশ: 2026-04-20 পরীক্ষিত হয়েছে: 2026-05-21 23:59 qwen/qwen3.6-max-preview::medium
(medium) (none)

সারাংশ

Qwen3.6 Max Preview AI BENCHY-তে 8.4 স্কোর করে এবং #14 স্থানে আছে। এর reliability 10.0, pass rate 80.0%, মোট খরচ $1.036, এবং গড় response time 58.41s.

Qwen3.6 Max Preview কে আলাদা করে যা: এটি অস্বাভাবিকভাবে বেশি reasoning tokens ব্যবহার করে, যা ধীর বা বেশি খরচের runs ব্যাখ্যা করতে পারে।

ধারাবাহিকতা

9.2

মোট আউটপুট টোকেন

133,033

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$1.040 / 1M

আউটপুট মূল্য

$6.240 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 5

প্রতি চেষ্টায় পাস রেট: 80.0%

অস্থির টেস্ট

2

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

58.41s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 238.07s

প্রতিক্রিয়া সময় (মোট): 1168.27s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#14 Qwen3.6 Max Preview

medium
Cost
$0.024
Time
76.5s
Tokens
3,861 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:25 নতুন টেস্ট যোগ হয়েছে 8.5 10.0 $0.960 তুলনা করুন
2026-05-21 23:59 স্যুইট পরিবর্তিত হয়েছে 8.4 10.0 $1.036 বর্তমান রান
2026-04-27 23:07 প্রথম রান 8.8 10.0 $0.823 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 10.0 10.0
কোডিং 8.2 6.7
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 2.9 7.2
Sadharon Buddhimotta 10.0 10.0
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 10.0 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল