नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs ByteDance Seed: Seed-2.0-Mini

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28 Seed-2.0-Mini Seed-2.0-Mini medium प्रकाशन: 2026-02-14
स्कोअर 7.3 7.1
क्रमांक #65 #75
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.0% 60.0%
अस्थिर चाचण्या 2 2
एकूण रन 60 60
प्रति निकाल खर्च 4.324 0.397
एकूण खर्च $0.519 $0.044
इनपुट किंमत $5.000 / 1M $0.100 / 1M
आउटपुट किंमत $25.000 / 1M $0.400 / 1M
आउटपुट टोकन्स 8,098 2,555
रिझनिंग टोकन्स 0 95,974
प्रतिसाद वेळ (सरासरी) 3.51s 80.22s
प्रतिसाद वेळ (कमाल) 17.73s 262.83s
प्रतिसाद वेळ (एकूण) 70.19s 1363.72s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Seed-2.0-Mini 7.1 9.8 50.0% 0 220.48s 464 34,964
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 527 5,667
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779

झटपट तुलना

तुलना जोडी बदला