नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs OpenAI: GPT-5.4 Mini

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-19

मेट्रिक Kimi K2.5 Kimi K2.5 medium प्रकाशन: 2026-01-27 GPT-5.4 Mini GPT-5.4 Mini medium प्रकाशन: 2026-03-17
स्कोअर 6.8 7.2
क्रमांक #76 #67
विश्वसनीयता 10.0 10.0
सुसंगतता 7.0 7.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.4% 68.4%
अस्थिर चाचण्या 7 5
एकूण रन 57 57
प्रति निकाल खर्च 2.616 3.443
एकूण खर्च $0.236 $0.345
???? ??? $0.400 / 1M $0.750 / 1M
????? ??? $1.900 / 1M $4.500 / 1M
आउटपुट टोकन्स 42,188 2,163
रिझनिंग टोकन्स 92,514 69,741
प्रतिसाद वेळ (सरासरी) 73.39s 16.00s
प्रतिसाद वेळ (कमाल) 150.77s 102.91s
प्रतिसाद वेळ (एकूण) 880.65s 303.99s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
GPT-5.4 Mini 10.0 10.0 100.0% 0 7.76s 423 1,548
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
GPT-5.4 Mini 7.4 6.7 66.7% 1 2.50s 129 1,337
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.33s 271 2,449
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 32 10,174

झटपट तुलना

तुलना जोडी बदला