नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs Hunter Alpha

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक MiniMax M2.5 MiniMax M2.5 medium प्रकाशन: 2026-02-12 Hunter Alpha Hunter Alpha none प्रकाशन: प्रकाशन तारीख अज्ञात
क्रमांक #49 #50
सरासरी स्कोअर 4.7 4.6
सुसंगतता 5.6 8.0
प्रति निकाल खर्च 4.981 0.000
एकूण खर्च $0.250 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 60.4% 52.1%
अस्थिर चाचण्या 9 4
एकूण रन 48 48
आउटपुट टोकन्स 107,044 2,272
रिझनिंग टोकन्स 206,190 0
प्रतिसाद वेळ (सरासरी) 43.03s 4.64s
प्रतिसाद वेळ (कमाल) 237.27s 15.17s
प्रतिसाद वेळ (एकूण) 387.25s 74.24s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 9.3 7.9 88.9% 1 32.42s 286 45,112
Hunter Alpha 1.3 7.4 22.2% 1 3.85s 773 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 10.0 2.1 66.7% 1 60.39s 740 9,713
Hunter Alpha 10.0 10.0 0.0% 0 15.17s 379 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 10.0 1.7 66.7% 2 7.48s 266 3,835
Hunter Alpha 9.9 10.0 100.0% 0 8.49s 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 10.0 4.4 22.2% 2 237.27s 105,047 133,487
Hunter Alpha 4.0 10.0 33.3% 0 2.33s 27 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 3.0 2.5 33.3% 1 6.63s 25 1,686
Hunter Alpha 5.0 3.1 66.7% 1 2.71s 91 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 8.0 6.8 83.3% 1 4.64s 252 1,873
Hunter Alpha 5.0 10.0 50.0% 0 2.82s 69 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 4.0 7.2 44.4% 1 11.54s 159 9,547
Hunter Alpha 4.0 4.4 66.7% 2 3.06s 349 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937
Hunter Alpha 10.0 10.0 100.0% 0 6.02s 335 0

झटपट तुलना

तुलना जोडी बदला