नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.5-9B vs Xiaomi: MiMo-V2.5

सारांश

Qwen3.5-9B vs MiMo-V2.5 benchmark तुलना: MiMo-V2.5 average score में आगे है: 4.9 vs 4.2. MiMo-V2.5 की benchmark लागत कम है: $0.007 vs $0.035. MiMo-V2.5 तेज है: 2.20s vs 82.24s, pass rates 27.0% vs 27.0%.

अनुशंसित मॉडल: MiMo-V2.5 - It has the best score here (4.9), while costing about 5.3x less than Qwen3.5-9B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक Qwen3.5-9B Qwen3.5-9B medium रिलीज़: 2026-03-02 MiMo-V2.5 MiMo-V2.5 none रिलीज़: 2026-04-22
स्कोर 4.2 4.9
रैंक #161 #143
विश्वसनीयता 6.7 10.0
संगति 8.0 9.6
सही परीक्षण
प्रति प्रयास पास दर 27.0% 27.0%
अस्थिर टेस्ट 5 1
कुल रन 63 63
प्रति परिणाम लागत 1.187 0.413
कुल लागत $0.035 $0.007
इनपुट कीमत $0.040 / 1M $0.140 / 1M
आउटपुट कीमत $0.150 / 1M $0.280 / 1M
कुल इनपुट टोकन 17,070 41,985
आउटपुट टोकन 29,045 2,267
रीजनिंग टोकन 209,516 0
प्रतिक्रिया समय (औसत) 82.24s 2.20s
प्रतिक्रिया समय (अधिकतम) 226.38s 6.86s
प्रतिक्रिया समय (कुल) 1315.88s 46.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#161 Qwen3.5-9B

medium
Cost
$0.001
Time
35.9s
Tokens
3,030 tok

#143 MiMo-V2.5

none
Cost
$0.007
Time
267.4s
Tokens
25,283 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
MiMo-V2.5 3.5 8.0 16.7% 1 2.19s 645 282 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
MiMo-V2.5 5.5 10.0 33.3% 0 3.24s 7,440 696 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
MiMo-V2.5 3.0 10.0 0.0% 0 2.36s 15,075 330 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
MiMo-V2.5 6.5 10.0 50.0% 0 1.01s 7,758 366 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
MiMo-V2.5 3.0 10.0 0.0% 0 756ms 753 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
MiMo-V2.5 4.4 9.9 0.0% 0 6.86s 498 81 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
MiMo-V2.5 6.5 10.0 50.0% 0 751ms 684 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
MiMo-V2.5 5.4 10.0 33.3% 0 2.13s 678 166 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
MiMo-V2.5 10.0 10.0 100.0% 0 2.43s 8,238 231 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694
MiMo-V2.5 3.0 10.0 0.0% 0 3.89s 216 16 0

त्वरित तुलना

तुलना जोड़ी बदलें