नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs MoonshotAI: Kimi K2.6

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none रिलीज़: 2026-02-14 Kimi K2.6 Kimi K2.6 none रिलीज़: 2026-04-20 निःशुल्क उपलब्ध
स्कोर 5.8 5.5
रैंक #110 #124
विश्वसनीयता 10.0 10.0
संगति 8.4 9.2
सही परीक्षण
प्रति प्रयास पास दर 46.0% 36.5%
अस्थिर टेस्ट 4 2
कुल रन 63 63
प्रति परिणाम लागत 0.228 1.267
कुल लागत $0.019 $0.079
इनपुट कीमत $0.250 / 1M $0.684 / 1M
आउटपुट कीमत $2.000 / 1M $3.420 / 1M
कुल इनपुट टोकन 46,573 32,916
आउटपुट टोकन 3,259 16,410
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 2.49s 13.27s
प्रतिक्रिया समय (अधिकतम) 6.70s 238.89s
प्रतिक्रिया समय (कुल) 52.26s 278.57s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 894 709 0
Kimi K2.6 4.6 10.0 25.0% 0 1.39s 618 471 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.6 10.0 33.3% 0 2.83s 8,215 410 0
Kimi K2.6 5.5 9.8 33.3% 0 82.57s 5,986 14,754 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 16,215 498 0
Kimi K2.6 3.0 10.0 0.0% 0 3.38s 11,269 290 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 8,538 246 0
Kimi K2.6 10.0 10.0 100.0% 0 1.32s 7,014 201 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 939 17 0
Kimi K2.6 5.3 7.2 44.4% 1 1.48s 732 42 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 570 294 0
Kimi K2.6 5.4 3.5 33.3% 1 1.55s 477 138 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 810 73 0
Kimi K2.6 6.5 10.0 50.0% 0 1.64s 669 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.3 7.2 44.4% 1 2.78s 858 709 0
Kimi K2.6 3.1 9.9 0.0% 0 1.40s 651 185 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 9,270 292 0
Kimi K2.6 10.0 10.0 100.0% 0 4.46s 5,286 240 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 1.96s 264 11 0
Kimi K2.6 3.0 10.0 0.0% 0 1.36s 214 17 0

त्वरित तुलना

तुलना जोड़ी बदलें