नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.5-9B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Kimi K2.5 Kimi K2.5 none प्रकाशन: 2026-01-27 Qwen3.5-9B Qwen3.5-9B medium प्रकाशन: 2026-03-02
क्रमांक #54 #66
सरासरी स्कोअर 4.1 2.6
सुसंगतता 8.6 7.4
प्रति निकाल खर्च 0.295 0.779
एकूण खर्च $0.015 $0.024
बरोबर चाचण्या
प्रति प्रयत्न पास दर 39.6% 35.4%
अस्थिर चाचण्या 3 5
एकूण रन 48 48
आउटपुट टोकन्स 2,000 17,930
रिझनिंग टोकन्स 0 139,706
प्रतिसाद वेळ (सरासरी) 11.91s 71.44s
प्रतिसाद वेळ (कमाल) 42.13s 226.38s
प्रतिसाद वेळ (एकूण) 107.16s 928.77s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 2.7 7.9 11.1% 1 11.38s 363 0
Qwen3.5-9B 4.0 7.2 55.6% 1 31.54s 2,410 10,913
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 2.1 33.3% 1 19.16s 748 0
Qwen3.5-9B 10.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 5.4 5.8 83.3% 1 42.13s 187 0
Qwen3.5-9B 5.0 5.6 33.3% 1 87.31s 1,383 32,113
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 4.0 10.0 33.3% 0 4.38s 29 0
Qwen3.5-9B 10.0 7.2 22.2% 1 137.75s 11,549 48,475
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Qwen3.5-9B 10.0 1.6 33.3% 1 226.38s 0 30,695
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 5.5 10.0 50.0% 0 2.67s 60 0
Qwen3.5-9B 5.5 5.8 66.7% 1 17.15s 599 4,517
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 0.0% 0 4.73s 317 0
Qwen3.5-9B 10.0 10.0 0.0% 0 33.38s 1,545 11,844
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

झटपट तुलना

तुलना जोडी बदला