नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

MoonshotAI: Kimi K2.5 vs Laguna Xs.2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Kimi K2.5 Kimi K2.5 none रिलीज़: 2026-01-27 Laguna Xs.2 Laguna Xs.2 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 5.5 6.2
रैंक #99 #80
विश्वसनीयता लागू नहीं 10.0
संगति 8.7 6.9
सही परीक्षण
प्रति प्रयास पास दर 40.7% 57.4%
अस्थिर टेस्ट 3 7
कुल रन 54 54
प्रति परिणाम लागत 0.271 0.000
कुल लागत $0.017 $0.000
???? ??? $0.440 / 1M $0.000 / 1M
????? ??? $2.000 / 1M $0.000 / 1M
आउटपुट टोकन 2,659 58,141
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 13.37s 6.03s
प्रतिक्रिया समय (अधिकतम) 42.13s 29.11s
प्रतिक्रिया समय (कुल) 147.05s 108.59s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Laguna Xs.2 7.4 5.9 83.3% 2 2.60s 5,283 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
Laguna Xs.2 6.3 3.7 33.3% 1 14.36s 7,896 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Laguna Xs.2 3.0 10.0 0.0% 0 15.92s 8,501 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Laguna Xs.2 7.1 5.6 83.3% 1 9.34s 10,472 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Laguna Xs.2 4.1 4.4 44.5% 2 11.12s 18,712 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Laguna Xs.2 4.1 10.0 0.0% 0 2.76s 1,421 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Laguna Xs.2 10.0 10.0 100.0% 0 1.68s 1,517 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
Laguna Xs.2 5.3 10.0 33.3% 0 2.12s 3,168 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Laguna Xs.2 4.7 1.6 66.7% 1 3.39s 1,171 0

त्वरित तुलना

तुलना जोड़ी बदलें