नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs MoonshotAI: Kimi K2.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-19

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium प्रकाशन: 2026-02-14 Kimi K2.5 Kimi K2.5 medium प्रकाशन: 2026-01-27
स्कोअर 7.2 6.8
क्रमांक #63 #76
विश्वसनीयता 3.3 10.0
सुसंगतता 9.2 7.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 63.2% 68.4%
अस्थिर चाचण्या 2 7
एकूण रन 57 57
प्रति निकाल खर्च 0.339 2.616
एकूण खर्च $0.038 $0.236
???? ??? $0.100 / 1M $0.400 / 1M
????? ??? $0.400 / 1M $1.900 / 1M
आउटपुट टोकन्स 2,469 42,188
रिझनिंग टोकन्स 81,017 92,514
प्रतिसाद वेळ (सरासरी) 68.89s 73.39s
प्रतिसाद वेळ (कमाल) 262.83s 150.77s
प्रतिसाद वेळ (एकूण) 1102.23s 880.65s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644

झटपट तुलना

तुलना जोडी बदला