नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

DeepSeek: DeepSeek V4 Pro vs Xiaomi: MiMo-V2.5-Pro

सारांश

DeepSeek V4 Pro vs MiMo-V2.5-Pro benchmark तुलना: MiMo-V2.5-Pro average score में आगे है: 7.4 vs 7.2. DeepSeek V4 Pro की benchmark लागत कम है: $0.034 vs $0.106. DeepSeek V4 Pro तेज है: 6.41s vs 26.13s, pass rates 52.4% vs 68.3%.

अनुशंसित मॉडल: DeepSeek V4 Pro - Its score stays close to the best score here (7.2 vs 7.4), while costing about 3.2x less than MiMo-V2.5-Pro.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक DeepSeek V4 Pro DeepSeek V4 Pro none रिलीज़: 2026-04-24 MiMo-V2.5-Pro MiMo-V2.5-Pro medium रिलीज़: 2026-04-22
स्कोर 7.2 7.4
रैंक #58 #51
विश्वसनीयता 9.9 10.0
संगति 8.8 8.5
सही परीक्षण
प्रति प्रयास पास दर 52.4% 68.3%
अस्थिर टेस्ट 3 4
कुल रन 63 63
प्रति परिणाम लागत 0.333 2.541
कुल लागत $0.034 $0.106
इनपुट कीमत $0.435 / 1M $0.435 / 1M
आउटपुट कीमत $0.870 / 1M $0.870 / 1M
कुल इनपुट टोकन 53,558 40,854
आउटपुट टोकन 11,424 5,015
रीजनिंग टोकन 0 97,742
प्रतिक्रिया समय (औसत) 6.41s 26.13s
प्रतिक्रिया समय (अधिकतम) 30.09s 130.77s
प्रतिक्रिया समय (कुल) 134.66s 548.65s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#51 MiMo-V2.5-Pro

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 621 323 1,179
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
MiMo-V2.5-Pro 6.2 4.7 66.7% 2 92.07s 6,543 780 51,218
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 15,060 348 11,870
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 7,746 260 8,383
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 630 275 17,023
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 492 155 163
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 672 82 803
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 660 540 2,181
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 8,220 311 2,908
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 210 1,941 2,014

त्वरित तुलना

तुलना जोड़ी बदलें