नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.6 27B vs Xiaomi: MiMo-V2.5

सारांश

Qwen3.6 27B vs MiMo-V2.5 benchmark तुलना: Qwen3.6 27B average score में आगे है: 5.6 vs 4.9. MiMo-V2.5 की benchmark लागत कम है: $0.007 vs $0.028. MiMo-V2.5 तेज है: 2.20s vs 3.72s, pass rates 47.6% vs 27.0%.

अनुशंसित मॉडल: MiMo-V2.5 - Its score stays close to the best score here (4.9 vs 5.6), while costing about 4.2x less than Qwen3.6 27B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक Qwen3.6 27B Qwen3.6 27B none रिलीज़: 2026-04-20 MiMo-V2.5 MiMo-V2.5 none रिलीज़: 2026-04-22
स्कोर 5.6 4.9
रैंक #118 #143
विश्वसनीयता 10.0 10.0
संगति 7.6 9.6
सही परीक्षण
प्रति प्रयास पास दर 47.6% 27.0%
अस्थिर टेस्ट 6 1
कुल रन 63 63
प्रति परिणाम लागत 0.467 0.413
कुल लागत $0.028 $0.007
इनपुट कीमत $0.290 / 1M $0.140 / 1M
आउटपुट कीमत $3.200 / 1M $0.280 / 1M
कुल इनपुट टोकन 52,721 41,985
आउटपुट टोकन 3,812 2,267
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 3.72s 2.20s
प्रतिक्रिया समय (अधिकतम) 11.82s 6.86s
प्रतिक्रिया समय (कुल) 78.08s 46.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#118 Qwen3.6 27B

none
Cost
$0.009
Time
83.0s
Tokens
4,549 tok

#143 MiMo-V2.5

none
Cost
$0.007
Time
267.4s
Tokens
25,283 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 3.8 3.7 41.7% 3 2.83s 696 490 0
MiMo-V2.5 3.5 8.0 16.7% 1 2.19s 645 282 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 5.5 10.0 33.3% 0 4.16s 7,913 539 0
MiMo-V2.5 5.5 10.0 33.3% 0 3.24s 7,440 696 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 3.0 10.0 0.0% 0 9.95s 22,497 1,401 0
MiMo-V2.5 3.0 10.0 0.0% 0 2.36s 15,075 330 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 7.3 5.8 83.3% 1 2.06s 7,788 248 0
MiMo-V2.5 6.5 10.0 50.0% 0 1.01s 7,758 366 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 7.7 10.0 66.7% 0 3.03s 789 24 0
MiMo-V2.5 3.0 10.0 0.0% 0 756ms 753 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 5.2 9.9 0.0% 0 1.07s 522 72 0
MiMo-V2.5 4.4 9.9 0.0% 0 6.86s 498 81 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 6.2 5.8 66.7% 1 1.92s 711 49 0
MiMo-V2.5 6.5 10.0 50.0% 0 751ms 684 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 5.3 7.2 44.4% 1 5.15s 714 639 0
MiMo-V2.5 5.4 10.0 33.3% 0 2.13s 678 166 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 9.5 10.0 100.0% 0 6.74s 10,881 339 0
MiMo-V2.5 10.0 10.0 100.0% 0 2.43s 8,238 231 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 3.0 10.0 0.0% 0 4.03s 210 11 0
MiMo-V2.5 3.0 10.0 0.0% 0 3.89s 216 16 0

त्वरित तुलना

तुलना जोड़ी बदलें