নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-27B vs xAI: Grok 4.20 Multi-Agent Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Qwen3.5-27B Qwen3.5-27B none প্রকাশ: 2026-02-24 Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium প্রকাশ: 2026-03-12
র‍্যাঙ্ক #46 #47
গড় স্কোর 4.9 4.9
ধারাবাহিকতা 9.1 7.1
প্রতি ফলাফলে খরচ 0.302 97.178
মোট খরচ $0.016 $4.859
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 37.5% 52.1%
অস্থির টেস্ট 2 6
মোট রান 48 48
আউটপুট টোকেন 3,161 293,634
রিজনিং টোকেন 0 291,260
প্রতিক্রিয়া সময় (গড়) 1.75s 9.08s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 9.39s 35.28s
প্রতিক্রিয়া সময় (মোট) 28.05s 127.09s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 4.0 10.0 33.3% 0 796ms 264 0
Grok 4.20 Multi-Agent Beta 4.0 4.4 66.7% 2 3.77s 28,392 27,808
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 10.0 1.6 33.3% 1 9.39s 1,461 0
Grok 4.20 Multi-Agent Beta 10.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 9.9 10.0 100.0% 0 1.43s 243 0
Grok 4.20 Multi-Agent Beta 9.9 10.0 100.0% 0 5.54s 25,306 25,051
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 10.0 10.0 0.0% 0 540ms 15 0
Grok 4.20 Multi-Agent Beta 10.0 7.2 11.1% 1 24.67s 164,609 163,647
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 126 0
Grok 4.20 Multi-Agent Beta 4.0 2.8 66.7% 1 6.40s 15,848 15,746
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 4.5 10.0 0.0% 0 815ms 69 0
Grok 4.20 Multi-Agent Beta 9.0 10.0 50.0% 0 4.63s 25,457 25,322
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 6.3 7.9 55.6% 1 1.37s 680 0
Grok 4.20 Multi-Agent Beta 6.3 5.1 77.8% 2 5.01s 34,022 33,686
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0
Grok 4.20 Multi-Agent Beta 10.0 10.0 0.0% 0 0ms 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান