नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Trinity Large Preview vs xAI: Grok 4.1 Fast

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Trinity Large Preview none रिलीज़: 2026-01-27 निःशुल्क उपलब्ध xAI: Grok 4.1 Fast medium रिलीज़: 2025-11-19
रैंक #45 #30
औसत स्कोर 4.2 6.2
संगति 9.6 7.9
प्रति परिणाम लागत 0.000 0.563
कुल लागत $0.000 $0.051
सही परीक्षण
प्रति प्रयास पास दर 33.3% 66.7%
अस्थिर टेस्ट 1 4
कुल रन 48 48
आउटपुट टोकन 1,837 1,183
रीजनिंग टोकन 0 83,875
प्रतिक्रिया समय (औसत) 3.15s 26.35s
प्रतिक्रिया समय (अधिकतम) 8.91s 121.79s
प्रतिक्रिया समय (कुल) 50.46s 237.11s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
xAI: Grok 4.1 Fast 10.0 10.0 100.0% 0 5.65s 102 4,021
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
xAI: Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
xAI: Grok 4.1 Fast 9.9 10.0 100.0% 0 6.63s 180 5,409
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
xAI: Grok 4.1 Fast 4.0 4.4 66.7% 2 121.79s 11 37,657
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
xAI: Grok 4.1 Fast 3.0 9.9 0.0% 0 16.25s 127 3,456
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
xAI: Grok 4.1 Fast 5.5 10.0 50.0% 0 5.30s 55 3,489
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
xAI: Grok 4.1 Fast 4.0 7.2 44.4% 1 8.08s 187 6,086
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
xAI: Grok 4.1 Fast 10.0 1.6 33.3% 1 27.71s 260 11,485

त्वरित तुलना

तुलना जोड़ी बदलें