AI BENCHY तुलना

Qwen: Qwen3.7 Plus vs Xiaomi: MiMo-V2.5-Pro

सारांश

Qwen3.7 Plus vs MiMo-V2.5-Pro benchmark तुलना: MiMo-V2.5-Pro average score में आगे है: 7.4 vs 7.2. Qwen3.7 Plus की benchmark लागत कम है: $0.023 vs $0.106. Qwen3.7 Plus तेज है: 2.85s vs 26.13s, pass rates 47.6% vs 68.3%.

अनुशंसित मॉडल: Qwen3.7 Plus - Its score stays close to the best score here (7.2 vs 7.4), while costing about 4.8x less than MiMo-V2.5-Pro.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक	Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03	MiMo-V2.5-Pro MiMo-V2.5-Pro medium रिलीज़: 2026-04-22

मेट्रिक	Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03	MiMo-V2.5-Pro MiMo-V2.5-Pro medium रिलीज़: 2026-04-22
स्कोर	7.2	7.4
रैंक	#61	#52
विश्वसनीयता	10.0	10.0
संगति	10.0	8.5
सही परीक्षण
प्रति प्रयास पास दर	47.6%	68.3%
अस्थिर टेस्ट	0	4
कुल रन	63	63
प्रति परिणाम लागत	0.276	2.541
कुल लागत	$0.023	$0.106
इनपुट कीमत	$0.320 / 1M	$0.435 / 1M
आउटपुट कीमत	$1.280 / 1M	$0.870 / 1M
कुल इनपुट टोकन	42,510	40,854
आउटपुट टोकन	6,578	5,015
रीजनिंग टोकन	0	97,742
प्रतिक्रिया समय (औसत)	2.85s	26.13s
प्रतिक्रिया समय (अधिकतम)	29.38s	130.77s
प्रतिक्रिया समय (कुल)	59.86s	548.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Qwen3.7 Plus

none

Cost: $0.019
Time: 213.5s
Tokens: 11,960 tok

#52 MiMo-V2.5-Pro

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	10.0	10.0	100.0%	0		29.38s	14,952	4,505	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	15,060	348	11,870

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

त्वरित तुलना

तुलना जोड़ी बदलें

Gemma 4 26B A4Bmediumनिःशुल्क उपलब्धvsQwen3.7 Plusnone Gemini 3 Flash PreviewlowvsMiMo-V2.5-Promedium Qwen3.7 PlusnonevsMiMo-V2-Flashmedium Qwen3.7 PlusnonevsStep 3.7 Flashhigh Qwen3.7 PlusnonevsGLM 5.1medium Qwen3.7 PlusnonevsGLM 5V Turbomedium GPT-5.3 ChatnonevsMiMo-V2.5-Promedium Claude Sonnet 4.6nonevsMiMo-V2.5-Promedium Kimi K2.7 CodemediumvsQwen3.7 Plusnone Qwen3.7 PlusnonevsGrok 4.20medium Claude Opus 4.8nonevsMiMo-V2.5-Promedium Gemini 3 Flash PreviewlowvsQwen3.7 Plusnone