نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Trinity Large Preview vs xAI: Grok 4.20

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-03

میٹرک Trinity Large Preview Trinity Large Preview none اجرا: 2026-01-27 Grok 4.20 Grok 4.20 none اجرا: 2026-03-31
اسکور 4.7 5.4
درجہ #148 #127
اعتماد پذیری 10.0 دستیاب نہیں
تسلسل 9.3 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 23.3% 33.3%
غیر مستحکم ٹیسٹ 2 0
کل رنز 60 54
فی نتیجہ لاگت 0.017 1.570
کل لاگت $0.008 $0.057
ان پٹ قیمت $0.243 / 1M $1.250 / 1M
آؤٹ پٹ قیمت $0.243 / 1M $2.500 / 1M
کل ان پٹ ٹوکنز 29,828 41,313
آؤٹ پٹ ٹوکنز 2,169 1,923
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 2.98s 1.11s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.34s 6.04s
ردِعمل کا وقت (کل) 56.57s 19.96s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 651 550 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 4.0 6.6 16.7% 1 14.34s 738 397 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 1,074 312 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 12,053 294 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 6,900 186 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 738 25 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 498 104 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 3.5 10.0 0.0% 0 822ms 678 63 0
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 3.6 7.7 11.1% 1 1.97s 669 265 0
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 6,699 267 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 204 18 0
Grok 4.20 - - - - - - - - -

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں