नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-26

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none प्रकाशन: 2026-02-14 Qwen3.5-Flash Qwen3.5-Flash none प्रकाशन: 2026-02-24
स्कोअर 6.2 6.2
क्रमांक #72 #70
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 7.7 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 55.6% 46.3%
अस्थिर चाचण्या 5 1
एकूण रन 54 54
प्रति निकाल खर्च 0.200 0.070
एकूण खर्च $0.016 $0.006
???? ??? $0.250 / 1M $0.065 / 1M
????? ??? $2.000 / 1M $0.260 / 1M
आउटपुट टोकन्स 3,129 4,266
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 2.53s 3.25s
प्रतिसाद वेळ (कमाल) 6.70s 13.73s
प्रतिसाद वेळ (एकूण) 45.46s 58.44s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.29s 489 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Qwen3.5-Flash 3.3 10.0 0.0% 0 5.90s 608 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0

झटपट तुलना

तुलना जोडी बदला