नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs ByteDance Seed: Seed-2.0-Lite

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none रिलीज़: 2026-04-16 Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14
स्कोर 9.2 8.6
रैंक #4 #6
संगति 10.0 8.8
सही परीक्षण
प्रति प्रयास पास दर 88.9% 83.3%
अस्थिर टेस्ट 0 3
कुल रन 54 54
प्रति परिणाम लागत 3.155 0.926
कुल लागत $0.505 $0.121
???? ??? $5.000 / 1M $0.250 / 1M
????? ??? $25.000 / 1M $2.000 / 1M
आउटपुट टोकन 6,326 3,257
रीजनिंग टोकन 0 52,042
प्रतिक्रिया समय (औसत) 3.13s 30.37s
प्रतिक्रिया समय (अधिकतम) 18.27s 168.71s
प्रतिक्रिया समय (कुल) 56.33s 546.72s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 74.49s 436 7,319
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011

त्वरित तुलना

तुलना जोड़ी बदलें