नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.5-9B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-22

मेट्रिक Kimi K2.5 Kimi K2.5 none प्रकाशन: 2026-01-27 Qwen3.5-9B Qwen3.5-9B none प्रकाशन: 2026-03-02
स्कोअर 5.3 4.6
क्रमांक #126 #142
विश्वसनीयता 10.0 10.0
सुसंगतता 8.9 9.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 36.7% 21.7%
अस्थिर चाचण्या 3 1
एकूण रन 60 60
प्रति निकाल खर्च 0.428 0.120
एकूण खर्च $0.026 $0.005
???? ??? $0.400 / 1M $0.040 / 1M
????? ??? $1.900 / 1M $0.150 / 1M
आउटपुट टोकन्स 6,734 3,984
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 14.16s 1.69s
प्रतिसाद वेळ (कमाल) 42.13s 5.91s
प्रतिसाद वेळ (एकूण) 184.10s 33.84s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.8 10.0 50.0% 0 35.97s 4,704 0
Qwen3.5-9B 4.4 6.7 16.7% 1 5.39s 1,033 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.0 10.0 0.0% 0 4.73s 317 0
Qwen3.5-9B 3.1 10.0 0.0% 0 683ms 388 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 20 0
Qwen3.5-9B 3.0 10.0 0.0% 0 2.32s 6 0

झटपट तुलना

तुलना जोडी बदला