नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.6 Max Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-27

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite medium प्रकाशन: 2026-02-14 Qwen3.6 Max Preview Qwen3.6 Max Preview none प्रकाशन: 2026-04-20
स्कोअर 8.6 7.3
क्रमांक #10 #56
विश्वसनीयता लागू नाही 10.0
सुसंगतता 8.8 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 83.3% 66.7%
अस्थिर चाचण्या 3 3
एकूण रन 54 54
प्रति निकाल खर्च 0.926 0.827
एकूण खर्च $0.121 $0.083
???? ??? $0.250 / 1M $1.300 / 1M
????? ??? $2.000 / 1M $7.800 / 1M
आउटपुट टोकन्स 3,257 4,732
रिझनिंग टोकन्स 52,042 0
प्रतिसाद वेळ (सरासरी) 30.37s 3.38s
प्रतिसाद वेळ (कमाल) 168.71s 20.51s
प्रतिसाद वेळ (एकूण) 546.72s 60.83s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 74.49s 436 7,319
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Qwen3.6 Max Preview 8.4 6.9 83.3% 1 1.45s 69 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0

झटपट तुलना

तुलना जोडी बदला