नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs ByteDance Seed: Seed-2.0-Lite

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium प्रकाशन: 2026-04-16 Seed-2.0-Lite Seed-2.0-Lite medium प्रकाशन: 2026-02-14
स्कोअर 8.9 8.1
क्रमांक #7 #24
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 8.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 85.0% 75.0%
अस्थिर चाचण्या 0 3
एकूण रन 60 60
प्रति निकाल खर्च 3.670 1.166
एकूण खर्च $0.624 $0.152
इनपुट किंमत $5.000 / 1M $0.250 / 1M
आउटपुट किंमत $25.000 / 1M $2.000 / 1M
आउटपुट टोकन्स 10,439 3,224
रिझनिंग टोकन्स 2,198 67,040
प्रतिसाद वेळ (सरासरी) 4.48s 36.67s
प्रतिसाद वेळ (कमाल) 23.18s 168.71s
प्रतिसाद वेळ (एकूण) 85.21s 733.46s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 14.79s 6,210 1,114
Seed-2.0-Lite 7.0 9.7 50.0% 0 107.65s 452 20,524
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 370 0
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 403 3,285
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 24 0
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 9 2,040

झटपट तुलना

तुलना जोडी बदला