#24
X AI · اجرا: 2026-03-12 · x-ai/grok-4.20-beta::medium
غیر مستحکم ٹیسٹ
2
غیر مستحکم ٹیسٹس میں رنز کے درمیان ملے جلے نتائج آئے (کم از کم ایک کامیاب اور ایک ناکام).
چارٹس
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
اوسط اسکور vs کل لاگت
ردِعمل کا وقت (اوسط)
اوسط اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اوسط اسکور vs کل آؤٹ پٹ ٹوکنز
فوری موازنہ
Grok 4.20 BetamediumvsMiMo-V2-FlashmediumGrok 4.20 BetamediumvsGemini 3 Flash PreviewnoneGrok 4.20 BetamediumvsSeed-2.0-MinimediumGrok 4.20 BetamediumvsGPT-5.3 ChatnoneGrok 4.20 BetamediumvsQwen3.5-FlashmediumGrok 4.20 BetamediumvsGemini 3 Flash PreviewmediumGrok 4.20 BetamediumvsGemini 3.1 Pro PreviewmediumGrok 4.20 BetamediumvsStep 3.5 Flashmediumمفت دستیاب
زمرہ وار تفصیل
| زمرہ | اوسط اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| اینٹی اے آئی چالیں | 7.0 | 7.2 | |
| مشترکہ | 10.0 | 10.0 | |
| ڈیٹا پارسنگ اور استخراج | 9.9 | 10.0 | |
| ڈومین مخصوص | 4.0 | 10.0 | |
| عمومی ذہانت | 10.0 | 10.0 | |
| ہدایات کی پیروی | 9.0 | 10.0 | |
| پہیلی حل کرنا | 7.0 | 7.2 | |
| ٹول کالنگ | 10.0 | 10.0 |