নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs xAI: Grok 4.20 Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none প্রকাশ: 2026-02-15 Grok 4.20 Beta Grok 4.20 Beta medium প্রকাশ: 2026-03-12
র‍্যাঙ্ক #31 #24
গড় স্কোর 6.2 7.0
ধারাবাহিকতা 9.6 9.0
প্রতি ফলাফলে খরচ 0.172 5.989
মোট খরচ $0.016 $0.599
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 58.3% 70.8%
অস্থির টেস্ট 1 2
মোট রান 48 48
আউটপুট টোকেন 2,015 1,481
রিজনিং টোকেন 0 86,628
প্রতিক্রিয়া সময় (গড়) 2.65s 8.89s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.65s 24.21s
প্রতিক্রিয়া সময় (মোট) 26.52s 142.18s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 2.74s 514 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 0.0% 0 6.65s 314 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 9.9 10.0 100.0% 0 1.89s 243 0
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 1.17s 17 0
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 4.0 3.0 33.3% 1 2.26s 117 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 7.0 10.0 66.7% 0 2.82s 516 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384

দ্রুত তুলনা

তুলনার জুটি বদলান