नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs Xiaomi: MiMo-V2-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-15

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 medium रिलीज़: 2025-12-01 MiMo-V2-Flash MiMo-V2-Flash medium रिलीज़: 2025-12-16
रैंक #14 #18
स्कोर 8.1 7.9
संगति 8.5 9.5
प्रति परिणाम लागत 0.225 0.316
कुल लागत $0.025 $0.035
सही परीक्षण
प्रति प्रयास पास दर 79.2% 72.9%
अस्थिर टेस्ट 3 1
कुल रन 48 48
आउटपुट टोकन 7,392 11,613
रीजनिंग टोकन 39,089 106,714
प्रतिक्रिया समय (औसत) 39.48s 25.33s
प्रतिक्रिया समय (अधिकतम) 93.11s 96.01s
प्रतिक्रिया समय (कुल) 631.71s 253.33s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 7.8 9.9 66.7% 0 33.39s 1,171 4,893
MiMo-V2-Flash 9.9 10.0 100.0% 0 16.79s 1,328 18,739
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 5.3 7.2 44.4% 1 39.32s 3,081 7,856
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 5.4 2.5 66.7% 1 31.30s 68 2,366
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.2 7.2 88.9% 1 36.87s 390 6,281
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

त्वरित तुलना

तुलना जोड़ी बदलें