नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs ByteDance Seed: Seed-2.0-Lite

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium रिलीज़: 2026-05-28 Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14
स्कोर 8.7 8.1
रैंक #12 #24
विश्वसनीयता 10.0 10.0
संगति 9.6 8.9
सही परीक्षण
प्रति प्रयास पास दर 83.3% 75.0%
अस्थिर टेस्ट 1 3
कुल रन 60 60
प्रति परिणाम लागत 6.285 1.166
कुल लागत $1.006 $0.152
इनपुट कीमत $5.000 / 1M $0.250 / 1M
आउटपुट कीमत $25.000 / 1M $2.000 / 1M
आउटपुट टोकन 23,201 3,224
रीजनिंग टोकन 5,901 67,040
प्रतिक्रिया समय (औसत) 9.34s 36.67s
प्रतिक्रिया समय (अधिकतम) 38.03s 168.71s
प्रतिक्रिया समय (कुल) 186.84s 733.46s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Seed-2.0-Lite 7.0 9.7 50.0% 0 107.65s 452 20,524
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 403 3,285
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 9 2,040

त्वरित तुलना

तुलना जोड़ी बदलें