नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs inclusionAI: Ring-2.6-1T

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium रिलीज़: 2026-05-28 Ring-2.6-1T Ring-2.6-1T medium रिलीज़: 2026-05-10
स्कोर 8.7 7.2
रैंक #12 #66
विश्वसनीयता 10.0 10.0
संगति 9.6 8.7
सही परीक्षण
प्रति प्रयास पास दर 83.3% 66.7%
अस्थिर टेस्ट 1 3
कुल रन 60 60
प्रति परिणाम लागत 6.285 0.000
कुल लागत $1.006 $0.033
इनपुट कीमत $5.000 / 1M $0.075 / 1M
आउटपुट कीमत $25.000 / 1M $0.625 / 1M
आउटपुट टोकन 23,201 21,752
रीजनिंग टोकन 5,901 42,754
प्रतिक्रिया समय (औसत) 9.34s 61.29s
प्रतिक्रिया समय (अधिकतम) 38.03s 304.19s
प्रतिक्रिया समय (कुल) 186.84s 1164.50s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 3,833 4,891
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Ring-2.6-1T 10.0 10.0 100.0% 0 59.65s 1,369 3,985
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 324 6,088
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 840 1,937
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 9,744 15,013
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 150 583
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 266 1,831
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 697 2,479
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 234 1,531
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 4,295 4,416

त्वरित तुलना

तुलना जोड़ी बदलें