नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs OpenAI: GPT-5.5

सारांश

Kimi K2.5 vs GPT-5.5 benchmark तुलना: Kimi K2.5 average score मध्ये पुढे आहे: 6.8 vs 6.4. GPT-5.5 चा benchmark खर्च कमी आहे: $0.231 vs $0.328. GPT-5.5 वेगवान आहे: 1.89s vs 98.43s, pass rates 68.3% vs 54.0%.

शिफारस केलेले मॉडेल: GPT-5.5 - Its score stays close to the best score here (6.4 vs 6.8), while responding about 52.1x faster than Kimi K2.5.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-04

मेट्रिक Kimi K2.5 Kimi K2.5 medium प्रकाशन: 2026-01-27 GPT-5.5 GPT-5.5 none प्रकाशन: 2026-04-24
स्कोअर 6.8 6.4
क्रमांक #76 #91
विश्वसनीयता 10.0 10.0
सुसंगतता 6.9 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.3% 54.0%
अस्थिर चाचण्या 8 3
एकूण रन 63 63
प्रति निकाल खर्च 3.704 2.302
एकूण खर्च $0.328 $0.231
इनपुट किंमत $0.400 / 1M $5.000 / 1M
आउटपुट किंमत $1.900 / 1M $30.000 / 1M
एकूण इनपुट टोकन्स 34,312 34,212
आउटपुट टोकन्स 48,379 1,971
रिझनिंग टोकन्स 157,747 0
प्रतिसाद वेळ (सरासरी) 98.43s 1.89s
प्रतिसाद वेळ (कमाल) 281.00s 5.56s
प्रतिसाद वेळ (एकूण) 1378.03s 39.64s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#76 MoonshotAI: Kimi K2.5

medium
Cost
$0.030
Time
58.6s
Tokens
8,683 tok

#91 GPT-5.5

none
Cost
$0.090
Time
54.3s
Tokens
3,063 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 634 2,789 8,880
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.1 4.6 66.7% 2 217.49s 6,935 5,705 74,693
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 11,280 703 3,713
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 7,020 563 7,940
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 485 20,753 30,564
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 480 3,815 4,262
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 675 5,371 6,547
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 5.3 7.3 44.4% 1 43.23s 659 8,426 12,692
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 5,933 242 812
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 211 12 7,644
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0

झटपट तुलना

तुलना जोडी बदला