خلاصہ
Grok Build 0.1 AI BENCHY پر 6.6 اسکور کرتا ہے اور #82 پر ہے۔ اس کی reliability 10.0، pass rate 60.4%، کل لاگت $0.547، اور اوسط response time 28.69s ہے۔
Grok Build 0.1 کو منفرد کیا بناتا ہے: یہ کوڈنگ میں سب سے نمایاں ہے، جہاں اس کا rank #1 ہے؛ جبکہ مشترکہ اس کا کمزور ترین حصہ ہے، rank #13.
آرکائیو شدہ ماڈل: اس ماڈل کو اب اپ ڈیٹ نہیں کیا جائے گا اور نئے ٹیسٹس پر ٹیسٹ نہیں کیا جائے گا
6.6
تسلسل
8.0
10.0
$0.547
کل آؤٹ پٹ ٹوکنز
267,275
کل ان پٹ ٹوکنز
0
ان پٹ قیمت
$1.000 / 1M
آؤٹ پٹ قیمت
$2.000 / 1M
غیر مستحکم ٹیسٹ
4
غیر مستحکم ٹیسٹس میں رنز کے درمیان ملے جلے نتائج آئے (کم از کم ایک کامیاب اور ایک ناکام).
رن ہسٹری
| ٹیسٹ کیا گیا | اسکور | اعتماد پذیری | درست ٹیسٹس | کل لاگت | موازنہ کریں |
|---|---|---|---|---|---|
| 2026-05-21 12:40 دوبارہ ٹیسٹ | 6.0 | 10.0 | $0.547 | موازنہ کریں | |
| 2026-05-21 12:40 دوبارہ ٹیسٹ | 6.6 | 10.0 | $0.547 | موجودہ رن |
چارٹس
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
اسکور vs کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
فوری موازنہ
زمرہ وار تفصیل
| زمرہ | اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| اینٹی اے آئی چالیں | 8.7 | 7.9 | |
| کوڈنگ | 10.0 | 10.0 | |
| مشترکہ | 0.0 | 0.0 | |
| ڈیٹا پارسنگ اور استخراج | 4.7 | 1.6 | |
| ڈومین مخصوص | 3.6 | 7.2 | |
| عمومی ذہانت | 4.3 | 10.0 | |
| ہدایات کی پیروی | 9.8 | 10.0 | |
| پہیلی حل کرنا | 6.4 | 7.7 | |
| ٹول کالنگ | 0.0 | 0.0 | |
| معلومات عامہ | 3.0 | 10.0 |