नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.5-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-01

मेट्रिक Kimi K2.5 Kimi K2.5 medium रिलीज़: 2026-01-27 Qwen3.5-Flash Qwen3.5-Flash none रिलीज़: 2026-02-24
स्कोर 6.7 5.9
रैंक #85 #104
विश्वसनीयता 10.0 10.0
संगति 6.8 9.7
सही परीक्षण
प्रति प्रयास पास दर 66.7% 41.7%
अस्थिर टेस्ट 8 1
कुल रन 60 60
प्रति परिणाम लागत 3.486 0.073
कुल लागत $0.272 $0.004
इनपुट कीमत $0.400 / 1M $0.065 / 1M
आउटपुट कीमत $1.900 / 1M $0.260 / 1M
आउटपुट टोकन 48,374 4,270
रीजनिंग टोकन 128,473 0
प्रतिक्रिया समय (औसत) 89.02s 3.74s
प्रतिक्रिया समय (अधिकतम) 281.00s 27.18s
प्रतिक्रिया समय (कुल) 1157.32s 74.71s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 4.1 1.9 50.0% 2 215.89s 5,700 45,419
Qwen3.5-Flash 6.8 10.0 50.0% 0 993ms 513 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 5.3 7.3 44.4% 1 43.23s 8,426 12,692
Qwen3.5-Flash 3.1 10.0 0.0% 0 10.89s 579 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644
Qwen3.5-Flash 3.0 10.0 0.0% 0 588ms 9 0

त्वरित तुलना

तुलना जोड़ी बदलें