AI BENCHY Compare
OpenAI: GPT-5.5 vs xAI: Grok 4.3
AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-01
| মেট্রিক | GPT-5.5 GPT-5.5 low | Grok 4.3 Grok 4.3 medium |
|---|---|---|
| স্কোর | 9.0 | 8.2 |
| র্যাঙ্ক | #5 | #20 |
| নির্ভরযোগ্যতা | 10.0 | 10.0 |
| ধারাবাহিকতা | 9.6 | 8.6 |
| সঠিক টেস্ট | ||
| প্রতি চেষ্টায় পাস রেট | 87.0% | 81.5% |
| অস্থির টেস্ট | 1 | 3 |
| মোট রান | 54 | 54 |
| প্রতি ফলাফলে খরচ | 4.534 | 3.974 |
| মোট খরচ | $0.681 | $0.517 |
| ???? ??? | $5.000 / 1M | $1.250 / 1M |
| ????? ??? | $30.000 / 1M | $2.500 / 1M |
| আউটপুট টোকেন | 1,959 | 1,223 |
| রিজনিং টোকেন | 16,134 | 187,047 |
| প্রতিক্রিয়া সময় (গড়) | 8.39s | 48.63s |
| প্রতিক্রিয়া সময় (সর্বোচ্চ) | 56.19s | 216.69s |
| প্রতিক্রিয়া সময় (মোট) | 151.01s | 875.27s |
স্কোর বনাম মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
বিভাগভিত্তিক বিশ্লেষণ
দ্রুত তুলনা
তুলনার জুটি বদলান
HY3 Previewlowবিনামূল্যে উপলভ্যvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumClaude Opus 4.7nonevsGPT-5.5lowClaude Opus 4.7mediumvsGPT-5.5lowGPT-5.5lowvsQwen3.6 Max PreviewmediumGPT-5.5lowvsQwen3.6 35B A3BmediumGPT-5.2 ChatnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumGPT-5.5lowvsHY3 Previewhighবিনামূল্যে উপলভ্যHY3 Previewhighবিনামূল্যে উপলভ্যvsGrok 4.3medium