नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs MoonshotAI: Kimi K2.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-26

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none प्रकाशन: 2026-02-14 Kimi K2.5 Kimi K2.5 medium प्रकाशन: 2026-01-27
स्कोअर 6.2 7.0
क्रमांक #72 #54
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 7.7 6.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 55.6% 72.2%
अस्थिर चाचण्या 5 7
एकूण रन 54 54
प्रति निकाल खर्च 0.200 2.444
एकूण खर्च $0.016 $0.220
???? ??? $0.250 / 1M $0.440 / 1M
????? ??? $2.000 / 1M $2.000 / 1M
आउटपुट टोकन्स 3,129 42,176
रिझनिंग टोकन्स 0 84,870
प्रतिसाद वेळ (सरासरी) 2.53s 72.43s
प्रतिसाद वेळ (कमाल) 6.70s 150.77s
प्रतिसाद वेळ (एकूण) 45.46s 796.70s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812

झटपट तुलना

तुलना जोडी बदला