नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

MoonshotAI: Kimi K2.5 vs OpenAI: gpt-oss-120b

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Kimi K2.5 Kimi K2.5 none रिलीज़: 2026-01-27 gpt-oss-120b gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध
स्कोर 5.3 5.6
रैंक #126 #111
विश्वसनीयता 10.0 10.0
संगति 8.9 7.5
सही परीक्षण
प्रति प्रयास पास दर 36.7% 46.7%
अस्थिर टेस्ट 3 6
कुल रन 60 60
प्रति परिणाम लागत 0.428 0.171
कुल लागत $0.026 $0.012
???? ??? $0.400 / 1M $0.000 / 1M
????? ??? $1.900 / 1M $0.000 / 1M
आउटपुट टोकन 6,734 17,213
रीजनिंग टोकन 0 46,706
प्रतिक्रिया समय (औसत) 14.16s 20.89s
प्रतिक्रिया समय (अधिकतम) 42.13s 68.16s
प्रतिक्रिया समय (कुल) 184.10s 271.54s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 6.8 10.0 50.0% 0 35.97s 4,704 0
gpt-oss-120b 3.9 5.6 33.3% 1 47.24s 847 8,618
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.0 10.0 0.0% 0 4.73s 317 0
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 20 0
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 3,101 3,758

त्वरित तुलना

तुलना जोड़ी बदलें