नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Qwen: Qwen3.5-9B vs Xiaomi: MiMo-V2-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक Qwen3.5-9B Qwen3.5-9B medium रिलीज़: 2026-03-02 MiMo-V2-Flash MiMo-V2-Flash none रिलीज़: 2025-12-16
रैंक #66 #64
औसत स्कोर 2.6 2.9
संगति 7.4 7.9
प्रति परिणाम लागत 0.779 0.743
कुल लागत $0.024 $0.023
सही परीक्षण
प्रति प्रयास पास दर 35.4% 29.2%
अस्थिर टेस्ट 5 4
कुल रन 48 48
आउटपुट टोकन 17,930 67,790
रीजनिंग टोकन 139,706 0
प्रतिक्रिया समय (औसत) 71.44s 2.97s
प्रतिक्रिया समय (अधिकतम) 226.38s 19.68s
प्रतिक्रिया समय (कुल) 928.77s 35.60s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 4.0 7.2 55.6% 1 31.54s 2,410 10,913
MiMo-V2-Flash 10.0 7.3 11.1% 1 1.36s 859 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 10.0 10.0 0.0% 0 0ms 0 0
MiMo-V2-Flash 10.0 10.0 0.0% 0 2.87s 330 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 5.0 5.6 33.3% 1 87.31s 1,383 32,113
MiMo-V2-Flash 10.0 5.8 16.7% 1 19.68s 161 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 10.0 7.2 22.2% 1 137.75s 11,549 48,475
MiMo-V2-Flash 4.0 7.2 44.4% 1 564ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 10.0 1.6 33.3% 1 226.38s 0 30,695
MiMo-V2-Flash 4.0 10.0 0.0% 0 1.67s 104 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 5.5 5.8 66.7% 1 17.15s 599 4,517
MiMo-V2-Flash 5.5 10.0 50.0% 0 857ms 69 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 10.0 10.0 0.0% 0 33.38s 1,545 11,844
MiMo-V2-Flash 10.0 7.2 22.2% 1 1.38s 65,971 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149
MiMo-V2-Flash 10.0 10.0 100.0% 0 2.28s 272 0

त्वरित तुलना

तुलना जोड़ी बदलें