নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs xAI: Grok 4.20

সারাংশ

Qwen3.6 Max Preview vs Grok 4.20 benchmark তুলনা: Grok 4.20 average score-এ এগিয়ে: 7.1 vs 6.9. Qwen3.6 Max Preview-এর benchmark খরচ কম: $0.075 vs $0.609. Qwen3.6 Max Preview দ্রুত: 3.30s vs 27.68s, pass rates 58.7% vs 63.5%.

প্রস্তাবিত মডেল: Qwen3.6 Max Preview - Its score stays close to the best score here (6.9 vs 7.1), while costing about 8.2x less than Grok 4.20.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-10

মেট্রিক Qwen3.6 Max Preview Qwen3.6 Max Preview none প্রকাশ: 2026-04-20 Grok 4.20 Grok 4.20 medium প্রকাশ: 2026-03-31
স্কোর 6.9 7.1
র‍্যাঙ্ক #75 #66
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 58.7% 63.5%
অস্থির টেস্ট 2 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.824 8.309
মোট খরচ $0.075 $0.609
ইনপুট মূল্য $1.040 / 1M $1.250 / 1M
আউটপুট মূল্য $6.240 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 42,509 44,433
আউটপুট টোকেন 4,779 1,819
রিজনিং টোকেন 0 219,524
প্রতিক্রিয়া সময় (গড়) 3.30s 27.68s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 20.51s 199.66s
প্রতিক্রিয়া সময় (মোট) 69.40s 581.26s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#75 Qwen3.6 Max Preview

none
Cost
$0.025
Time
83.9s
Tokens
4,066 tok

#66 xAI: Grok 4.20

medium
Cost
$0.041
Time
110.3s
Tokens
16,336 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

দ্রুত তুলনা

তুলনার জুটি বদলান