नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Trinity Large Preview vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03

मेट्रिक Trinity Large Preview Trinity Large Preview none प्रकाशन: 2026-01-27 Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 4.7 5.4
क्रमांक #148 #127
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 9.3 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 23.3% 33.3%
अस्थिर चाचण्या 2 0
एकूण रन 60 54
प्रति निकाल खर्च 0.017 1.570
एकूण खर्च $0.008 $0.057
इनपुट किंमत $0.243 / 1M $1.250 / 1M
आउटपुट किंमत $0.243 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 29,828 41,313
आउटपुट टोकन्स 2,169 1,923
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 2.98s 1.11s
प्रतिसाद वेळ (कमाल) 14.34s 6.04s
प्रतिसाद वेळ (एकूण) 56.57s 19.96s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 651 550 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.0 6.6 16.7% 1 14.34s 738 397 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 12,053 294 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 6,900 186 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 738 25 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 498 104 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.5 10.0 0.0% 0 822ms 678 63 0
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.6 7.7 11.1% 1 1.97s 669 265 0
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 6,699 267 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 204 18 0
Grok 4.20 - - - - - - - - -

झटपट तुलना

तुलना जोडी बदला