नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Qwen: Qwen3.5-Flash vs Xiaomi: MiMo-V2-Omni

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-21

मेट्रिक Qwen3.5-Flash Qwen3.5-Flash none रिलीज़: 2026-02-24 MiMo-V2-Omni MiMo-V2-Omni medium रिलीज़: 2026-03-18
स्कोर 6.0 7.9
रैंक #48 #22
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 43.1% 64.7%
अस्थिर टेस्ट 1 0
कुल रन 51 17
प्रति परिणाम लागत 0.077 0.763
कुल लागत $0.006 $0.084
???? ??? $0.065 / 1M $0.400 / 1M
????? ??? $0.260 / 1M $2.000 / 1M
आउटपुट टोकन 3,777 663
रीजनिंग टोकन 0 39,001
प्रतिक्रिया समय (औसत) 3.36s 13.71s
प्रतिक्रिया समय (अधिकतम) 13.73s 158.78s
प्रतिक्रिया समय (कुल) 57.15s 233.06s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-Flash 3.3 10.0 0.0% 0 5.90s 608 0
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306

त्वरित तुलना

तुलना जोड़ी बदलें