নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs xAI: Grok 4.20

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-02

মেট্রিক Qwen3.5-Flash Qwen3.5-Flash none প্রকাশ: 2026-02-24 Grok 4.20 Grok 4.20 medium প্রকাশ: 2026-03-31
স্কোর 6.0 7.1
র‍্যাঙ্ক #54 #40
ধারাবাহিকতা 9.6 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 43.1% 66.7%
অস্থির টেস্ট 1 4
মোট রান 51 51
প্রতি ফলাফলে খরচ 0.077 7.358
মোট খরচ $0.006 $0.663
???? ??? $0.065 / 1M $2.000 / 1M
????? ??? $0.260 / 1M $6.000 / 1M
আউটপুট টোকেন 3,777 1,494
রিজনিং টোকেন 0 97,078
প্রতিক্রিয়া সময় (গড়) 3.36s 9.50s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 13.73s 29.87s
প্রতিক্রিয়া সময় (মোট) 57.15s 161.54s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-Flash 3.3 10.0 0.0% 0 5.90s 608 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

দ্রুত তুলনা

তুলনার জুটি বদলান