नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs inclusionAI: Ring-2.6-1T

सारांश

Claude Sonnet 4.6 vs Ring-2.6-1T benchmark तुलना: Claude Sonnet 4.6 average score में आगे है: 7.3 vs 6.8. Ring-2.6-1T की benchmark लागत कम है: $0.033 vs $0.316. Claude Sonnet 4.6 तेज है: 5.04s vs 61.29s, pass rates 55.6% vs 60.3%.

अनुशंसित मॉडल: Ring-2.6-1T - Its score stays close to the best score here (6.8 vs 7.3), while costing about 9.6x less than Claude Sonnet 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 Ring-2.6-1T Ring-2.6-1T medium रिलीज़: 2026-05-10
स्कोर 7.3 6.8
रैंक #55 #72
विश्वसनीयता 10.0 10.0
संगति 9.7 8.8
सही परीक्षण
प्रति प्रयास पास दर 55.6% 60.3%
अस्थिर टेस्ट 1 3
कुल रन 63 63
प्रति परिणाम लागत 2.870 0.000
कुल लागत $0.316 $0.033
इनपुट कीमत $3.000 / 1M $0.075 / 1M
आउटपुट कीमत $15.000 / 1M $0.625 / 1M
कुल इनपुट टोकन 57,886 35,892
आउटपुट टोकन 9,465 21,752
रीजनिंग टोकन 0 42,754
प्रतिक्रिया समय (औसत) 5.04s 61.29s
प्रतिक्रिया समय (अधिकतम) 23.84s 304.19s
प्रतिक्रिया समय (कुल) 70.60s 1164.50s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#55 Claude Sonnet 4.6

none
लागत
$0.038
समय
27.3s
टोकन
2,598 tok

#72 Ring-2.6-1T

medium
Ring-2.6-1T is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ring-2.6-1t
लागत
$0.000
समय
0.1s
टोकन
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 810 3,833 4,891
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Ring-2.6-1T 5.3 10.0 33.3% 0 59.65s 834 1,369 3,985
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 14,823 324 6,088
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 8,046 840 1,937
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 873 9,744 15,013
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 561 150 583
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 774 266 1,831
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 792 697 2,479
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 8,136 234 1,531
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 243 4,295 4,416

त्वरित तुलना

तुलना जोड़ी बदलें