नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Inception: Mercury 2 vs inclusionAI: Ring-2.6-1T

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24 Ring-2.6-1T Ring-2.6-1T none रिलीज़: 2026-05-10
स्कोर 6.5 6.4
रैंक #89 #93
विश्वसनीयता 10.0 10.0
संगति 8.8 9.3
सही परीक्षण
प्रति प्रयास पास दर 51.7% 50.0%
अस्थिर टेस्ट 3 2
कुल रन 60 60
प्रति परिणाम लागत 0.611 0.000
कुल लागत $0.055 $0.026
इनपुट कीमत $0.250 / 1M $0.075 / 1M
आउटपुट कीमत $0.750 / 1M $0.625 / 1M
कुल इनपुट टोकन 32,570 7,599
आउटपुट टोकन 4,022 39,954
रीजनिंग टोकन 58,405 0
प्रतिक्रिया समय (औसत) 2.27s 55.10s
प्रतिक्रिया समय (अधिकतम) 14.63s 143.82s
प्रतिक्रिया समय (कुल) 43.20s 881.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 810 5,575 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
Ring-2.6-1T 6.5 10.0 50.0% 0 143.82s 834 5,036 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
Ring-2.6-1T 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 2,712 1,529 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 873 17,728 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 561 846 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 774 2,004 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 792 3,469 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
Ring-2.6-1T 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 243 3,767 0

त्वरित तुलना

तुलना जोड़ी बदलें