नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Mini vs MoonshotAI: Kimi K2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-19

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium रिलीज़: 2026-02-14 Kimi K2.5 Kimi K2.5 medium रिलीज़: 2026-01-27
स्कोर 7.2 6.8
रैंक #63 #76
विश्वसनीयता 3.3 10.0
संगति 9.2 7.0
सही परीक्षण
प्रति प्रयास पास दर 63.2% 68.4%
अस्थिर टेस्ट 2 7
कुल रन 57 57
प्रति परिणाम लागत 0.339 2.616
कुल लागत $0.038 $0.236
???? ??? $0.100 / 1M $0.400 / 1M
????? ??? $0.400 / 1M $1.900 / 1M
आउटपुट टोकन 2,469 42,188
रीजनिंग टोकन 81,017 92,514
प्रतिक्रिया समय (औसत) 68.89s 73.39s
प्रतिक्रिया समय (अधिकतम) 262.83s 150.77s
प्रतिक्रिया समय (कुल) 1102.23s 880.65s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644

त्वरित तुलना

तुलना जोड़ी बदलें