नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

MoonshotAI: Kimi K2.5 vs OpenAI: gpt-oss-120b

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-11

मेट्रिक Kimi K2.5 Kimi K2.5 none रिलीज़: 2026-01-27 gpt-oss-120b gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध
स्कोर 5.5 5.8
रैंक #72 #65
संगति 8.7 7.2
सही परीक्षण
प्रति प्रयास पास दर 40.7% 51.9%
अस्थिर टेस्ट 3 6
कुल रन 54 54
प्रति परिणाम लागत 0.271 0.144
कुल लागत $0.017 $0.011
???? ??? $0.383 / 1M $0.039 / 1M
????? ??? $1.720 / 1M $0.190 / 1M
आउटपुट टोकन 2,659 13,493
रीजनिंग टोकन 0 36,879
प्रतिक्रिया समय (औसत) 13.37s 16.08s
प्रतिक्रिया समय (अधिकतम) 42.13s 50.92s
प्रतिक्रिया समय (कुल) 147.05s 176.88s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083

त्वरित तुलना

तुलना जोड़ी बदलें