নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-27B vs xAI: Grok 4.20

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-02

মেট্রিক Qwen3.5-27B Qwen3.5-27B none প্রকাশ: 2026-02-24 Grok 4.20 Grok 4.20 none প্রকাশ: 2026-03-31
স্কোর 5.6 5.4
র‍্যাঙ্ক #65 #69
ধারাবাহিকতা 9.1 9.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 35.3% 31.4%
অস্থির টেস্ট 2 1
মোট রান 51 51
প্রতি ফলাফলে খরচ 0.303 1.809
মোট খরচ $0.016 $0.091
???? ??? $0.195 / 1M $2.000 / 1M
????? ??? $1.560 / 1M $6.000 / 1M
আউটপুট টোকেন 3,164 1,655
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 1.70s 1.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 9.39s 6.04s
প্রতিক্রিয়া সময় (মোট) 28.82s 18.80s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 4.8 10.0 25.0% 0 788ms 267 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 2.8 1.6 33.3% 1 9.39s 1,461 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 10.0 10.0 100.0% 0 1.43s 243 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 3.0 10.0 0.0% 0 540ms 15 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 126 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 4.8 10.0 0.0% 0 815ms 69 0
Grok 4.20 4.8 10.0 0.0% 0 455ms 60 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 6.7 7.9 55.6% 1 1.37s 680 0
Grok 4.20 5.3 7.4 44.4% 1 487ms 242 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0

দ্রুত তুলনা

তুলনার জুটি বদলান