नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Xiaomi: MiMo-V2-Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-15

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite medium प्रकाशन: 2026-02-14 MiMo-V2-Flash MiMo-V2-Flash medium प्रकाशन: 2025-12-16
क्रमांक #3 #18
स्कोअर 8.8 7.9
सुसंगतता 8.7 9.5
प्रति निकाल खर्च 0.870 0.316
एकूण खर्च $0.105 $0.035
बरोबर चाचण्या
प्रति प्रयत्न पास दर 87.5% 72.9%
अस्थिर चाचण्या 3 1
एकूण रन 48 48
आउटपुट टोकन्स 2,815 11,613
रिझनिंग टोकन्स 44,618 106,714
प्रतिसाद वेळ (सरासरी) 29.39s 25.33s
प्रतिसाद वेळ (कमाल) 168.71s 96.01s
प्रतिसाद वेळ (एकूण) 470.29s 253.33s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 23.34s 990 7,037
MiMo-V2-Flash 9.9 10.0 100.0% 0 16.79s 1,328 18,739
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

झटपट तुलना

तुलना जोडी बदला