नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Laguna M.1

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक Kimi K2.5 Kimi K2.5 none प्रकाशन: 2026-01-27 Laguna M.1 Laguna M.1 medium प्रकाशन: 2026-04-28 मोफत उपलब्ध
स्कोअर 5.5 6.3
क्रमांक #99 #73
विश्वसनीयता लागू नाही 10.0
सुसंगतता 8.7 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 40.7% 53.7%
अस्थिर चाचण्या 3 3
एकूण रन 54 54
प्रति निकाल खर्च 0.271 0.000
एकूण खर्च $0.017 $0.000
???? ??? $0.440 / 1M $0.000 / 1M
????? ??? $2.000 / 1M $0.000 / 1M
आउटपुट टोकन्स 2,659 63,822
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 13.37s 13.90s
प्रतिसाद वेळ (कमाल) 42.13s 53.14s
प्रतिसाद वेळ (एकूण) 147.05s 250.28s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Laguna M.1 6.6 10.0 50.0% 0 9.15s 7,839 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
Laguna M.1 4.3 1.1 66.7% 1 35.61s 14,327 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Laguna M.1 3.0 10.0 0.0% 0 53.14s 12,272 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Laguna M.1 10.0 10.0 100.0% 0 4.93s 2,296 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Laguna M.1 5.3 7.2 44.4% 1 24.14s 19,020 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Laguna M.1 4.1 10.0 0.0% 0 6.86s 1,294 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Laguna M.1 10.0 10.0 100.0% 0 4.30s 1,626 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
Laguna M.1 3.6 7.2 22.2% 1 6.97s 3,978 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Laguna M.1 10.0 10.0 100.0% 0 6.31s 1,170 0

झटपट तुलना

तुलना जोडी बदला