नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs ByteDance Seed: Seed-2.0-Lite

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium प्रकाशन: 2026-05-28 Seed-2.0-Lite Seed-2.0-Lite medium प्रकाशन: 2026-02-14
स्कोअर 8.7 8.1
क्रमांक #12 #24
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 8.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 83.3% 75.0%
अस्थिर चाचण्या 1 3
एकूण रन 60 60
प्रति निकाल खर्च 6.285 1.166
एकूण खर्च $1.006 $0.152
इनपुट किंमत $5.000 / 1M $0.250 / 1M
आउटपुट किंमत $25.000 / 1M $2.000 / 1M
आउटपुट टोकन्स 23,201 3,224
रिझनिंग टोकन्स 5,901 67,040
प्रतिसाद वेळ (सरासरी) 9.34s 36.67s
प्रतिसाद वेळ (कमाल) 38.03s 168.71s
प्रतिसाद वेळ (एकूण) 186.84s 733.46s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Seed-2.0-Lite 7.0 9.7 50.0% 0 107.65s 452 20,524
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 403 3,285
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 9 2,040

झटपट तुलना

तुलना जोडी बदला