नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs MoonshotAI: Kimi K2.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-24

मेट्रिक DeepSeek V4 Flash DeepSeek V4 Flash none प्रकाशन: 2026-04-24 Kimi K2.5 Kimi K2.5 none प्रकाशन: 2026-01-27
स्कोअर 5.3 5.5
क्रमांक #89 #85
सुसंगतता 9.1 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 40.7%
अस्थिर चाचण्या 2 3
एकूण रन 54 54
प्रति निकाल खर्च 0.147 0.271
एकूण खर्च $0.008 $0.017
???? ??? $0.140 / 1M $0.440 / 1M
????? ??? $0.280 / 1M $2.000 / 1M
आउटपुट टोकन्स 4,444 2,659
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 29.39s 13.37s
प्रतिसाद वेळ (कमाल) 111.96s 42.13s
प्रतिसाद वेळ (एकूण) 529.10s 147.05s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 174 0
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 6.3 10.0 0.0% 0 24.04s 471 0
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 2,664 0
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 195 0
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 18 0
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 67 0
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 321 0
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 3.1 7.3 11.1% 1 22.96s 207 0
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 327 0
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0

झटपट तुलना

तुलना जोडी बदला