নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Qwen: Qwen3.6 Max Preview

সারাংশ

Claude Opus 4.6 vs Qwen3.6 Max Preview benchmark তুলনা: Claude Opus 4.6 average score-এ এগিয়ে: 7.0 vs 6.9. Qwen3.6 Max Preview-এর benchmark খরচ কম: $0.075 vs $2.053. Qwen3.6 Max Preview দ্রুত: 3.30s vs 25.89s, pass rates 61.9% vs 58.7%.

প্রস্তাবিত মডেল: Qwen3.6 Max Preview - Its score stays close to the best score here (6.9 vs 7.0), while costing about 27.7x less than Claude Opus 4.6.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-10

মেট্রিক Claude Opus 4.6 Claude Opus 4.6 medium প্রকাশ: 2026-02-05 Qwen3.6 Max Preview Qwen3.6 Max Preview none প্রকাশ: 2026-04-20
স্কোর 7.0 6.9
র‍্যাঙ্ক #70 #75
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 61.9% 58.7%
অস্থির টেস্ট 3 2
মোট রান 63 63
প্রতি ফলাফলে খরচ 17.103 0.824
মোট খরচ $2.053 $0.075
ইনপুট মূল্য $5.000 / 1M $1.040 / 1M
আউটপুট মূল্য $25.000 / 1M $6.240 / 1M
মোট ইনপুট টোকেন 53,227 42,509
আউটপুট টোকেন 47,446 4,779
রিজনিং টোকেন 24,000 0
প্রতিক্রিয়া সময় (গড়) 25.89s 3.30s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 83.40s 20.51s
প্রতিক্রিয়া সময় (মোট) 362.49s 69.40s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#70 Claude Opus 4.6

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#75 Qwen3.6 Max Preview

none
Cost
$0.025
Time
83.9s
Tokens
4,066 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0

দ্রুত তুলনা

তুলনার জুটি বদলান