नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

DeepSeek: DeepSeek V3.2 vs MoonshotAI: Kimi K2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-26

मेट्रिक DeepSeek V3.2 DeepSeek V3.2 none रिलीज़: 2025-12-01 Kimi K2.5 Kimi K2.5 none रिलीज़: 2026-01-27
स्कोर 5.7 5.3
रैंक #109 #128
विश्वसनीयता 10.0 10.0
संगति 8.3 8.9
सही परीक्षण
प्रति प्रयास पास दर 48.3% 36.7%
अस्थिर टेस्ट 4 3
कुल रन 98 98
प्रति परिणाम लागत 0.246 0.447
कुल लागत $0.020 $0.027
???? ??? $0.252 / 1M $0.400 / 1M
????? ??? $0.378 / 1M $1.900 / 1M
आउटपुट टोकन 14,503 6,767
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 14.43s 14.06s
प्रतिक्रिया समय (अधिकतम) 115.89s 42.13s
प्रतिक्रिया समय (कुल) 288.55s 182.72s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.3 8.2 12.5% 1 9.35s 1,073 0
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.1 5.4 16.7% 1 20.87s 4,522 0
Kimi K2.5 6.8 10.0 50.0% 0 35.97s 4,704 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.0 6.9 16.7% 1 4.17s 21 0
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 7.6 10.0 100.0% 0 9.32s 43 0
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 8.9 10.0 100.0% 0 6.91s 3,642 0
Kimi K2.5 3.0 10.0 0.0% 0 4.04s 350 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 17 0
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 20 0

त्वरित तुलना

तुलना जोड़ी बदलें