AI BENCHY Compare
xAI: Grok 4.20 vs xAI: Grok 4.3
AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-01
| মেট্রিক | Grok 4.20 Grok 4.20 medium | Grok 4.3 Grok 4.3 medium |
|---|---|---|
| স্কোর | 7.0 | 8.2 |
| র্যাঙ্ক | #63 | #20 |
| নির্ভরযোগ্যতা | প্রযোজ্য নয় | 10.0 |
| ধারাবাহিকতা | 7.8 | 8.6 |
| সঠিক টেস্ট | ||
| প্রতি চেষ্টায় পাস রেট | 66.7% | 81.5% |
| অস্থির টেস্ট | 5 | 3 |
| মোট রান | 54 | 54 |
| প্রতি ফলাফলে খরচ | 8.252 | 3.974 |
| মোট খরচ | $0.743 | $0.517 |
| ???? ??? | $2.000 / 1M | $1.250 / 1M |
| ????? ??? | $6.000 / 1M | $2.500 / 1M |
| আউটপুট টোকেন | 1,744 | 1,223 |
| রিজনিং টোকেন | 109,882 | 187,047 |
| প্রতিক্রিয়া সময় (গড়) | 10.33s | 48.63s |
| প্রতিক্রিয়া সময় (সর্বোচ্চ) | 29.87s | 216.69s |
| প্রতিক্রিয়া সময় (মোট) | 185.87s | 875.27s |
স্কোর বনাম মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
বিভাগভিত্তিক বিশ্লেষণ
দ্রুত তুলনা
তুলনার জুটি বদলান
DeepSeek V4 ProhighvsGrok 4.20mediumGemma 4 31Bnoneবিনামূল্যে উপলভ্যvsGrok 4.20mediumHY3 Previewlowবিনামূল্যে উপলভ্যvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumGPT-5.5nonevsGrok 4.20mediumGPT-5.2 ChatnonevsGrok 4.3mediumGrok 4.20mediumvsGLM 5noneGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumHY3 Previewhighবিনামূল্যে উপলভ্যvsGrok 4.3medium