तुलना करें चार्ट

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

Qwen: Qwen3.5-35B-A3B vs Xiaomi: MiMo-V2-Flash

मॉडल नाम:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए: : 2026-02-27 15:16

सारांश

मेट्रिक	Qwen: Qwen3.5-35B-A3B medium रिलीज़: रिलीज़ तिथि अज्ञात	Xiaomi: MiMo-V2-Flash medium रिलीज़: रिलीज़ तिथि अज्ञात
रैंक	#22	#21
स्कोर	5.93	6.00
संगति	6.62	8.79
प्रति परिणाम लागत	5.169	0.364
कुल लागत	$0.362	$0.030
सही परीक्षण
गलत टेस्ट	7	6
प्रति प्रयास पास दर	73.8%	64.3%
अस्थिर टेस्ट	6	2
आउटपुट टोकन	1,317	11,650
रीजनिंग टोकन	177,502	93,283

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Qwen: Qwen3.5-35B-A3B	10.00	10.00	100.0%	0		429	36,235
Xiaomi: MiMo-V2-Flash	9.67	9.99	100.0%	0		1,328	18,739

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Qwen: Qwen3.5-35B-A3B	5.50	5.87	83.3%	1		235	19,493
Xiaomi: MiMo-V2-Flash	5.50	10.00	50.0%	0		153	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Qwen: Qwen3.5-35B-A3B	1.00	4.41	44.5%	2		41	46,368
Xiaomi: MiMo-V2-Flash	4.00	7.21	55.6%	1		8,363	51,202

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Qwen: Qwen3.5-35B-A3B	8.00	6.80	66.7%	1		97	17,361
Xiaomi: MiMo-V2-Flash	9.50	9.99	100.0%	0		72	3,504

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Qwen: Qwen3.5-35B-A3B	4.33	4.70	66.7%	2		206	56,680
Xiaomi: MiMo-V2-Flash	1.00	7.14	11.1%	1		1,413	7,123

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Qwen: Qwen3.5-35B-A3B	10.00	10.00	100.0%	0		309	1,365
Xiaomi: MiMo-V2-Flash	10.00	10.00	100.0%	0		321	12,715

तुलना जोड़ी बदलें

Qwen: Qwen3.5-35B-A3B की तुलना इससे करें...

Xiaomi: MiMo-V2-Flash की तुलना इससे करें...