AI BENCHY Compare
OpenAI: GPT-5.2 vs xAI: Grok 4.20
AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-10
| মেট্রিক | GPT-5.2 GPT-5.2 medium | Grok 4.20 Grok 4.20 medium |
|---|---|---|
| স্কোর | 7.2 | 6.9 |
| র্যাঙ্ক | #60 | #68 |
| নির্ভরযোগ্যতা | 10.0 | 10.0 |
| ধারাবাহিকতা | 8.2 | 8.3 |
| সঠিক টেস্ট | ||
| প্রতি চেষ্টায় পাস রেট | 68.4% | 63.2% |
| অস্থির টেস্ট | 4 | 4 |
| মোট রান | 57 | 57 |
| প্রতি ফলাফলে খরচ | 3.609 | 7.559 |
| মোট খরচ | $0.397 | $0.756 |
| ???? ??? | $1.750 / 1M | $1.250 / 1M |
| ????? ??? | $14.000 / 1M | $2.500 / 1M |
| আউটপুট টোকেন | 2,731 | 1,784 |
| রিজনিং টোকেন | 22,200 | 128,233 |
| প্রতিক্রিয়া সময় (গড়) | 15.22s | 14.53s |
| প্রতিক্রিয়া সময় (সর্বোচ্চ) | 77.80s | 63.48s |
| প্রতিক্রিয়া সময় (মোট) | 182.59s | 276.06s |
স্কোর বনাম মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
বিভাগভিত্তিক বিশ্লেষণ
দ্রুত তুলনা
তুলনার জুটি বদলান
DeepSeek V4 ProhighvsGrok 4.20mediumGemma 4 31Bnoneবিনামূল্যে উপলভ্যvsGrok 4.20mediumClaude Sonnet 4.6nonevsGPT-5.2mediumRing 2.6 1tnoneবিনামূল্যে উপলভ্যvsGPT-5.2mediumGemini 3.1 Flash LiteminimalvsGrok 4.20mediumGPT-5.2mediumvsQwen3.6 Max PreviewnoneGPT-5.5nonevsGrok 4.20mediumGemini 3.1 Flash LitenonevsGrok 4.20mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumClaude Sonnet 4.6nonevsGrok 4.20mediumGemma 4 31Bnoneবিনামূল্যে উপলভ্যvsGPT-5.2mediumDeepSeek V4 FlashhighvsGPT-5.2medium