नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Ring 2.6 1t vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10

मेट्रिक Ring 2.6 1t Ring 2.6 1t medium रिलीज़: 2026-05-10 निःशुल्क उपलब्ध Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 7.2 5.4
रैंक #55 #115
विश्वसनीयता 9.9 लागू नहीं
संगति 8.7 9.5
सही परीक्षण
प्रति प्रयास पास दर 66.7% 35.2%
अस्थिर टेस्ट 3 1
कुल रन 57 54
प्रति परिणाम लागत 0.000 1.574
कुल लागत $0.000 $0.095
???? ??? $0.000 / 1M $1.250 / 1M
????? ??? $0.000 / 1M $2.500 / 1M
आउटपुट टोकन 21,752 1,967
रीजनिंग टोकन 42,754 0
प्रतिक्रिया समय (औसत) 61.29s 1.11s
प्रतिक्रिया समय (अधिकतम) 304.19s 6.04s
प्रतिक्रिया समय (कुल) 1164.50s 20.02s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 10.0 10.0 100.0% 0 42.21s 3,833 4,891
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 10.0 10.0 100.0% 0 59.65s 1,369 3,985
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 10.0 10.0 100.0% 0 304.19s 324 6,088
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 6.5 10.0 50.0% 0 37.36s 840 1,937
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 3.5 4.4 33.3% 2 64.92s 9,744 15,013
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 4.1 10.0 0.0% 0 58.26s 150 583
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 9.8 10.0 100.0% 0 11.78s 266 1,831
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 5.9 7.2 55.6% 1 20.73s 697 2,479
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 10.0 10.0 100.0% 0 104.44s 234 1,531
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring 2.6 1t 3.0 10.0 0.0% 0 113.91s 4,295 4,416
Grok 4.20 - - - - - - - -

त्वरित तुलना

तुलना जोड़ी बदलें