নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.7 Plus vs xAI: Grok 4.20

সারাংশ

Qwen3.7 Plus vs Grok 4.20 benchmark তুলনা: Grok 4.20 average score-এ এগিয়ে: 7.3 vs 7.2. Qwen3.7 Plus-এর benchmark খরচ কম: $0.023 vs $0.609. Qwen3.7 Plus দ্রুত: 2.85s vs 27.68s, pass rates 47.6% vs 63.5%.

প্রস্তাবিত মডেল: Qwen3.7 Plus - Its score stays close to the best score here (7.2 vs 7.3), while costing about 27.6x less than Grok 4.20.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Qwen3.7 Plus Qwen3.7 Plus none প্রকাশ: 2026-06-03 Grok 4.20 Grok 4.20 medium প্রকাশ: 2026-03-31
স্কোর 7.2 7.3
র‍্যাঙ্ক #61 #54
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 10.0 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 47.6% 63.5%
অস্থির টেস্ট 0 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.276 8.309
মোট খরচ $0.023 $0.609
ইনপুট মূল্য $0.320 / 1M $1.250 / 1M
আউটপুট মূল্য $1.280 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 42,510 44,433
আউটপুট টোকেন 6,578 1,819
রিজনিং টোকেন 0 219,524
প্রতিক্রিয়া সময় (গড়) 2.85s 27.68s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 29.38s 199.66s
প্রতিক্রিয়া সময় (মোট) 59.86s 581.26s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Qwen3.7 Plus

none
Cost
$0.019
Time
213.5s
Tokens
11,960 tok

#54 xAI: Grok 4.20

medium
Cost
$0.041
Time
110.3s
Tokens
16,336 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

দ্রুত তুলনা

তুলনার জুটি বদলান