नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.5 Plus 2026-02-15 vs Xiaomi: MiMo-V2.5

सारांश

Qwen3.5 Plus 2026-02-15 vs MiMo-V2.5 benchmark तुलना: MiMo-V2.5 average score में आगे है: 6.7 vs 5.8. Qwen3.5 Plus 2026-02-15 की benchmark लागत कम है: $0.016 vs $0.063. Qwen3.5 Plus 2026-02-15 तेज है: 2.31s vs 27.11s, pass rates 46.0% vs 69.8%.

अनुशंसित मॉडल: Qwen3.5 Plus 2026-02-15 - It offers the best overall trade-off: a competitive score (5.8), lower cost than MiMo-V2.5, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none रिलीज़: 2026-02-15 MiMo-V2.5 MiMo-V2.5 medium रिलीज़: 2026-04-22
स्कोर 5.8 6.7
रैंक #106 #76
विश्वसनीयता 10.0 10.0
संगति 9.4 8.1
सही परीक्षण
प्रति प्रयास पास दर 46.0% 69.8%
अस्थिर टेस्ट 2 5
कुल रन 63 63
प्रति परिणाम लागत 0.204 2.966
कुल लागत $0.016 $0.063
इनपुट कीमत $0.260 / 1M $0.140 / 1M
आउटपुट कीमत $1.560 / 1M $0.280 / 1M
कुल इनपुट टोकन 45,864 41,838
आउटपुट टोकन 2,480 2,827
रीजनिंग टोकन 0 198,898
प्रतिक्रिया समय (औसत) 2.31s 27.11s
प्रतिक्रिया समय (अधिकतम) 6.65s 162.44s
प्रतिक्रिया समय (कुल) 34.63s 569.38s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#106 Qwen3.5 Plus 2026-02-15

none
लागत
$0.012
समय
153.2s
टोकन
7,787 tok

#76 MiMo-V2.5

medium
लागत
$0.002
समय
54.8s
टोकन
5,247 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 696 517 0
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 621 281 1,739
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.3 7.9 11.1% 1 2.05s 7,913 473 0
MiMo-V2.5 6.2 4.7 66.7% 2 97.14s 7,422 557 81,977
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 18,304 314 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 15,060 363 7,609
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 7,794 243 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 7,746 306 5,714
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 789 17 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 735 507 49,478
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 522 117 0
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 492 121 418
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 711 72 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 672 88 801
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.71s 714 494 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.25s 660 279 33,254
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 8,211 222 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 8,220 303 2,424
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 1.11s 210 11 0
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 210 22 15,484

त्वरित तुलना

तुलना जोड़ी बदलें