नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Google: Gemini 3.1 Pro Preview vs MoonshotAI: Kimi K2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium रिलीज़: 2026-02-19 Kimi K2.5 Kimi K2.5 medium रिलीज़: 2026-01-27
स्कोर 9.6 7.0
रैंक #2 #60
विश्वसनीयता लागू नहीं लागू नहीं
संगति 10.0 6.8
सही परीक्षण
प्रति प्रयास पास दर 94.4% 72.2%
अस्थिर टेस्ट 0 7
कुल रन 54 54
प्रति परिणाम लागत 3.400 2.444
कुल लागत $0.578 $0.220
???? ??? $2.000 / 1M $0.440 / 1M
????? ??? $12.000 / 1M $2.000 / 1M
आउटपुट टोकन 1,932 42,176
रीजनिंग टोकन 40,542 84,870
प्रतिक्रिया समय (औसत) 15.96s 72.43s
प्रतिक्रिया समय (अधिकतम) 40.61s 150.77s
प्रतिक्रिया समय (कुल) 175.52s 796.70s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812

त्वरित तुलना

तुलना जोड़ी बदलें