नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.7 Max vs Xiaomi: MiMo-V2-Flash

सारांश

Qwen3.7 Max vs MiMo-V2-Flash benchmark तुलना: MiMo-V2-Flash average score में आगे है: 7.1 vs 6.9. MiMo-V2-Flash की benchmark लागत कम है: $0.043 vs $0.054. Qwen3.7 Max तेज है: 1.30s vs 20.11s, pass rates 66.7% vs 65.1%.

अनुशंसित मॉडल: Qwen3.7 Max - Its score stays close to the best score here (6.9 vs 7.1), while responding about 15.5x faster than MiMo-V2-Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Qwen3.7 Max Qwen3.7 Max none रिलीज़: 2026-05-22 MiMo-V2-Flash MiMo-V2-Flash medium रिलीज़: 2025-12-16
स्कोर 6.9 7.1
रैंक #69 #62
विश्वसनीयता 10.0 10.0
संगति 10.0 8.8
सही परीक्षण
प्रति प्रयास पास दर 66.7% 65.1%
अस्थिर टेस्ट 0 3
कुल रन 63 63
प्रति परिणाम लागत 0.744 0.343
कुल लागत $0.054 $0.043
इनपुट कीमत $1.250 / 1M $0.100 / 1M
आउटपुट कीमत $3.750 / 1M $0.300 / 1M
कुल इनपुट टोकन 37,107 40,111
आउटपुट टोकन 1,994 12,476
रीजनिंग टोकन 0 125,039
प्रतिक्रिया समय (औसत) 1.30s 20.11s
प्रतिक्रिया समय (अधिकतम) 3.92s 96.01s
प्रतिक्रिया समय (कुल) 27.21s 301.59s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#69 Qwen3.7 Max

none
Cost
$0.046
Time
195.0s
Tokens
12,171 tok

#62 MiMo-V2-Flash

medium
Invalid SVG
Cost
$0.020
Time
284.1s
Tokens
65,689 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 696 242 0
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 621 1,674 23,559
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 5.5 10.0 33.3% 0 1.35s 7,911 582 0
MiMo-V2-Flash 6.0 7.2 55.6% 1 10.71s 7,177 474 13,505
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 9,549 171 0
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 18,676 442 26,859
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 7,794 243 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 2,622 153 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 789 15 0
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 739 8,374 42,461
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 522 120 0
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 492 87 488
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 711 72 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 678 75 3,504
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 714 314 0
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.87s 670 864 1,948
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 8,211 222 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 8,220 321 12,715
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 210 13 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.96s 216 12 0

त्वरित तुलना

तुलना जोड़ी बदलें