नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Inception: Mercury 2 vs inclusionAI: Ring-2.6-1T

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24 Ring-2.6-1T Ring-2.6-1T medium रिलीज़: 2026-05-10
स्कोर 6.5 7.0
रैंक #89 #74
विश्वसनीयता 10.0 10.0
संगति 8.8 8.7
सही परीक्षण
प्रति प्रयास पास दर 51.7% 63.3%
अस्थिर टेस्ट 3 3
कुल रन 60 60
प्रति परिणाम लागत 0.611 0.000
कुल लागत $0.055 $0.033
इनपुट कीमत $0.250 / 1M $0.075 / 1M
आउटपुट कीमत $0.750 / 1M $0.625 / 1M
कुल इनपुट टोकन 32,570 35,892
आउटपुट टोकन 4,022 21,752
रीजनिंग टोकन 58,405 42,754
प्रतिक्रिया समय (औसत) 2.27s 61.29s
प्रतिक्रिया समय (अधिकतम) 14.63s 304.19s
प्रतिक्रिया समय (कुल) 43.20s 1164.50s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 810 3,833 4,891
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
Ring-2.6-1T 6.5 10.0 50.0% 0 59.65s 834 1,369 3,985
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 14,823 324 6,088
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 8,046 840 1,937
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 873 9,744 15,013
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 561 150 583
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 774 266 1,831
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 792 697 2,479
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 8,136 234 1,531
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 243 4,295 4,416

त्वरित तुलना

तुलना जोड़ी बदलें