नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.6 35B A3B vs Xiaomi: MiMo-V2.5

सारांश

Qwen3.6 35B A3B vs MiMo-V2.5 benchmark तुलना: Qwen3.6 35B A3B average score में आगे है: 7.4 vs 7.3. MiMo-V2.5 की benchmark लागत कम है: $0.063 vs $0.146. Qwen3.6 35B A3B तेज है: 18.08s vs 27.11s, pass rates 63.5% vs 69.8%.

अनुशंसित मॉडल: MiMo-V2.5 - Its score stays close to the best score here (7.3 vs 7.4), while costing about 2.3x less than Qwen3.6 35B A3B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक Qwen3.6 35B A3B Qwen3.6 35B A3B medium रिलीज़: 2026-04-20 MiMo-V2.5 MiMo-V2.5 medium रिलीज़: 2026-04-22
स्कोर 7.4 7.3
रैंक #46 #56
विश्वसनीयता 10.0 10.0
संगति 9.6 8.1
सही परीक्षण
प्रति प्रयास पास दर 63.5% 69.8%
अस्थिर टेस्ट 1 5
कुल रन 63 63
प्रति परिणाम लागत 1.094 2.966
कुल लागत $0.146 $0.063
इनपुट कीमत $0.140 / 1M $0.140 / 1M
आउटपुट कीमत $1.000 / 1M $0.280 / 1M
कुल इनपुट टोकन 16,385 41,838
आउटपुट टोकन 19,632 2,827
रीजनिंग टोकन 130,219 198,898
प्रतिक्रिया समय (औसत) 18.08s 27.11s
प्रतिक्रिया समय (अधिकतम) 86.11s 162.44s
प्रतिक्रिया समय (कुल) 343.61s 569.38s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#46 Qwen3.6 35B A3B

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#56 MiMo-V2.5

medium
Cost
$0.002
Time
54.8s
Tokens
5,247 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 672 1,154 12,385
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 621 281 1,739
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 7.7 10.0 66.7% 0 50.55s 5,051 7,929 37,223
MiMo-V2.5 6.2 4.7 66.7% 2 97.14s 7,422 557 81,977
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 15,060 363 7,609
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 7,776 2,591 9,968
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 7,746 306 5,714
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 771 6,193 39,116
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 735 507 49,478
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 516 129 4,569
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 492 121 418
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 699 219 7,404
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 672 88 801
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 8.0 10.0 66.7% 0 5.95s 696 655 9,228
MiMo-V2.5 8.2 7.2 88.9% 1 20.25s 660 279 33,254
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 8,220 303 2,424
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 204 762 10,326
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 210 22 15,484

त्वरित तुलना

तुलना जोड़ी बदलें