नेविगेशन
AI BENCHY
तुलना करें चार्ट
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs xAI: Grok 4.1 Fast

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक Inception: Mercury 2 none रिलीज़: 2026-02-24 xAI: Grok 4.1 Fast medium रिलीज़: 2025-11-19
रैंक #50 #28
औसत स्कोर 3.4 6.4
सही परीक्षण
संगति 8.9 7.8
प्रति परिणाम लागत 0.147 0.541
कुल लागत $0.006 $0.049
प्रति प्रयास पास दर 33.3% 71.1%
अस्थिर टेस्ट 2 4
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन 1,144 1,056
रीजनिंग टोकन 0 80,419
प्रतिक्रिया समय (औसत) 594ms 27.61s
प्रतिक्रिया समय (अधिकतम) 1.27s 121.79s
प्रतिक्रिया समय (कुल) 8.91s 220.87s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 0.0% 0 466ms 274 0
xAI: Grok 4.1 Fast 10.0 10.0 100.0% 0 5.65s 102 4,021
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 0.0% 0 606ms 131 0
xAI: Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 5.5 5.9 83.3% 1 667ms 180 0
xAI: Grok 4.1 Fast 9.9 10.0 100.0% 0 6.63s 180 5,409
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 4.0 7.2 44.4% 1 534ms 46 0
xAI: Grok 4.1 Fast 4.0 4.4 66.7% 2 121.79s 11 37,657
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 5.5 10.0 50.0% 0 551ms 82 0
xAI: Grok 4.1 Fast 5.5 10.0 50.0% 0 5.30s 55 3,489
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 0.0% 0 533ms 234 0
xAI: Grok 4.1 Fast 4.0 7.2 44.4% 1 8.08s 187 6,086
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
xAI: Grok 4.1 Fast 10.0 1.6 33.3% 1 27.71s 260 11,485

त्वरित तुलना

तुलना जोड़ी बदलें