Qwen3.7 Max

Qwen প্রকাশ: 2026-05-22 পরীক্ষিত হয়েছে: 2026-05-21 23:55 qwen/qwen3.7-max::medium

(medium) (none)

সারাংশ

Qwen3.7 Max AI BENCHY-তে 9.0 স্কোর করে এবং #5 স্থানে আছে। এর reliability 10.0, pass rate 88.3%, মোট খরচ $0.942, এবং গড় response time 13.83s.

Qwen3.7 Max কে আলাদা করে যা: এটি সামগ্রিকভাবে সর্বোচ্চ rank করা মডেলগুলোর একটি।

স্কোর

9.0

ধারাবাহিকতা

9.6

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.942

মোট আউটপুট টোকেন

112,394

মোট ইনপুট টোকেন

ইনপুট মূল্য

$2.500 / 1M

আউটপুট মূল্য

$7.500 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 3

প্রতি চেষ্টায় পাস রেট: 88.3%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

13.83s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 33.37s

প্রতিক্রিয়া সময় (মোট): 276.53s

ভুল উত্তর: 3

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 Qwen3.7 Max

medium

খরচ: $0.017
সময়: 68.8s
টোকেন: 4,526 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	সঠিক টেস্ট	মোট খরচ	তুলনা করুন
2026-06-04 13:24 নতুন টেস্ট যোগ হয়েছে	9.1	10.0		$0.523 ↓	তুলনা করুন
2026-05-21 23:55 প্রথম রান	9.0	10.0		$0.942	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-05-21 23:55 · প্রথম রান	9.0	9.6	10.0	17/20	1	112,394	0	$0.942	13.83s
2026-06-04 13:24 · নতুন টেস্ট যোগ হয়েছে	9.1	9.6	10.0	18/21	1	125,088	42,360	$0.523	16.02s
পার্থক্য	-0.1	0.0	0.0	-1	0	-12694	-42360	+$0.420	-2198ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.7 MaxmediumvsGemini 3 Flash Previewmedium Qwen3.7 MaxmediumvsGPT-5.5low Qwen3.7 MaxmediumvsGemini 3.5 Flashhigh Qwen3.7 MaxmediumvsGemini 3.5 Flashlow Qwen3.7 MaxmediumvsClaude Fable 5medium Qwen3.7 MaxmediumvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	10.0	10.0
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.9	7.2
Sadharon Buddhimotta	10.0	10.0
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	10.0	10.0
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

Qwen3.7 Max

Hamster playing table tennis

#5 Qwen3.7 Max

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল