नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Qwen: Qwen3.5-27B vs Xiaomi: MiMo-V2-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-20

मेट्रिक Qwen3.5-27B Qwen3.5-27B none रिलीज़: 2026-02-24 MiMo-V2-Pro MiMo-V2-Pro none रिलीज़: 2026-03-18
स्कोर 5.6 5.8
रैंक #56 #54
संगति 9.1 8.5
सही परीक्षण
प्रति प्रयास पास दर 35.3% 45.1%
अस्थिर टेस्ट 2 3
कुल रन 51 51
प्रति परिणाम लागत 0.303 0.659
कुल लागत $0.016 $0.040
???? ??? $0.195 / 1M $1.000 / 1M
????? ??? $1.560 / 1M $3.000 / 1M
आउटपुट टोकन 3,164 1,721
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.70s 2.31s
प्रतिक्रिया समय (अधिकतम) 9.39s 6.58s
प्रतिक्रिया समय (कुल) 28.82s 39.25s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 4.8 10.0 25.0% 0 788ms 267 0
MiMo-V2-Pro 3.5 8.0 16.7% 1 1.80s 315 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 2.8 1.6 33.3% 1 9.39s 1,461 0
MiMo-V2-Pro 3.0 10.0 0.0% 0 6.58s 333 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 1.43s 243 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 1.39s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 3.0 10.0 0.0% 0 540ms 15 0
MiMo-V2-Pro 5.3 7.2 44.4% 1 1.78s 26 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 126 0
MiMo-V2-Pro 4.3 9.9 0.0% 0 2.44s 125 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 4.8 10.0 0.0% 0 815ms 69 0
MiMo-V2-Pro 6.5 10.0 50.0% 0 2.51s 69 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 6.7 7.9 55.6% 1 1.37s 680 0
MiMo-V2-Pro 6.0 7.1 55.6% 1 1.83s 327 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.39s 277 0

त्वरित तुलना

तुलना जोड़ी बदलें