नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

inclusionAI: Ring-2.6-1T vs Owl Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Ring-2.6-1T Ring-2.6-1T medium रिलीज़: 2026-05-10 Owl Alpha Owl Alpha none रिलीज़: 2026-04-30
स्कोर 7.2 5.7
रैंक #61 #106
विश्वसनीयता 9.9 10.0
संगति 8.7 9.2
सही परीक्षण
प्रति प्रयास पास दर 66.7% 41.7%
अस्थिर टेस्ट 3 2
कुल रन 60 60
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.075 / 1M $0.000 / 1M
????? ??? $0.625 / 1M $0.000 / 1M
आउटपुट टोकन 21,752 4,864
रीजनिंग टोकन 42,754 0
प्रतिक्रिया समय (औसत) 61.29s 8.84s
प्रतिक्रिया समय (अधिकतम) 304.19s 47.10s
प्रतिक्रिया समय (कुल) 1164.50s 176.83s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 3,833 4,891
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 10.0 10.0 100.0% 0 59.65s 1,369 3,985
Owl Alpha 7.0 9.9 50.0% 0 39.68s 3,629 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 324 6,088
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 840 1,937
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 9,744 15,013
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 150 583
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 266 1,831
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 697 2,479
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 234 1,531
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 4,295 4,416
Owl Alpha 3.0 10.0 0.0% 0 2.50s 14 0

त्वरित तुलना

तुलना जोड़ी बदलें