नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V3.2

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite medium प्रकाशन: 2026-02-14 DeepSeek V3.2 DeepSeek V3.2 none प्रकाशन: 2025-12-01
क्रमांक #3 #37
सरासरी स्कोअर 8.5 5.5
सुसंगतता 8.7 8.4
प्रति निकाल खर्च 0.870 0.220
एकूण खर्च $0.105 $0.016
बरोबर चाचण्या
प्रति प्रयत्न पास दर 87.5% 54.2%
अस्थिर चाचण्या 3 3
एकूण रन 48 48
आउटपुट टोकन्स 2,815 7,823
रिझनिंग टोकन्स 44,618 0
प्रतिसाद वेळ (सरासरी) 29.39s 12.86s
प्रतिसाद वेळ (कमाल) 168.71s 115.89s
प्रतिसाद वेळ (एकूण) 470.29s 205.78s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 23.34s 990 7,037
DeepSeek V3.2 10.0 9.7 0.0% 0 8.79s 1,411 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
DeepSeek V3.2 8.0 10.0 0.0% 0 115.89s 2,887 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.9 10.0 100.0% 0 9.07s 246 1,742
DeepSeek V3.2 5.4 5.8 66.7% 1 9.42s 1,710 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 4.0 7.2 55.6% 1 88.74s 15 23,897
DeepSeek V3.2 10.0 7.2 22.2% 1 1.61s 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 7.0 3.6 66.7% 1 18.25s 304 1,620
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.3 7.9 88.9% 1 11.03s 461 3,532
DeepSeek V3.2 7.7 7.5 88.9% 1 7.37s 1,136 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0

झटपट तुलना

तुलना जोडी बदला