नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs ByteDance Seed: Seed-2.0-Lite

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14
स्कोर 8.9 8.1
रैंक #7 #24
विश्वसनीयता 10.0 10.0
संगति 10.0 8.9
सही परीक्षण
प्रति प्रयास पास दर 85.0% 75.0%
अस्थिर टेस्ट 0 3
कुल रन 60 60
प्रति परिणाम लागत 3.670 1.166
कुल लागत $0.624 $0.152
इनपुट कीमत $5.000 / 1M $0.250 / 1M
आउटपुट कीमत $25.000 / 1M $2.000 / 1M
आउटपुट टोकन 10,439 3,224
रीजनिंग टोकन 2,198 67,040
प्रतिक्रिया समय (औसत) 4.48s 36.67s
प्रतिक्रिया समय (अधिकतम) 23.18s 168.71s
प्रतिक्रिया समय (कुल) 85.21s 733.46s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 14.79s 6,210 1,114
Seed-2.0-Lite 7.0 9.7 50.0% 0 107.65s 452 20,524
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 370 0
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 403 3,285
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 24 0
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 9 2,040

त्वरित तुलना

तुलना जोड़ी बदलें