#47
X AI · اجرا: 2026-03-12 · x-ai/grok-4.20-multi-agent-beta::medium
غیر مستحکم ٹیسٹ
6
غیر مستحکم ٹیسٹس میں رنز کے درمیان ملے جلے نتائج آئے (کم از کم ایک کامیاب اور ایک ناکام).
چارٹس
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
اوسط اسکور vs کل لاگت
ردِعمل کا وقت (اوسط)
اوسط اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اوسط اسکور vs کل آؤٹ پٹ ٹوکنز
فوری موازنہ
Grok 4.20 Multi-Agent BetamediumvsSeed-2.0-LitenoneGrok 4.20 Multi-Agent BetamediumvsQwen3.5-122B-A10BnoneGrok 4.20 Multi-Agent BetamediumvsQwen3.5-35B-A3BnoneGrok 4.20 Multi-Agent Betamediumvsgpt-oss-120bmediumمفت دستیابGrok 4.20 Multi-Agent BetamediumvsMiniMax M2.5mediumGrok 4.20 Multi-Agent BetamediumvsGemini 3 Flash PreviewmediumGrok 4.20 Multi-Agent BetamediumvsGemini 3.1 Pro PreviewmediumGrok 4.20 Multi-Agent BetamediumvsStep 3.5 Flashmediumمفت دستیاب
زمرہ وار تفصیل
| زمرہ | اوسط اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| اینٹی اے آئی چالیں | 4.0 | 4.4 | |
| مشترکہ | 10.0 | 10.0 | |
| ڈیٹا پارسنگ اور استخراج | 9.9 | 10.0 | |
| ڈومین مخصوص | 10.0 | 7.2 | |
| عمومی ذہانت | 4.0 | 2.8 | |
| ہدایات کی پیروی | 9.0 | 10.0 | |
| پہیلی حل کرنا | 6.3 | 5.1 | |
| ٹول کالنگ | 10.0 | 10.0 |