नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs xAI: Grok 4.20

सारांश

MiniMax M2.5 vs Grok 4.20 benchmark तुलना: MiniMax M2.5 average score मध्ये पुढे आहे: 4.7 vs 4.4. Grok 4.20 चा benchmark खर्च कमी आहे: $0.057 vs $0.164. Grok 4.20 वेगवान आहे: 1.11s vs 65.37s, pass rates 46.0% vs 28.6%.

शिफारस केलेले मॉडेल: Grok 4.20 - Its score stays close to the best score here (4.4 vs 4.7), while costing about 2.9x less than MiniMax M2.5.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक MiniMax M2.5 MiniMax M2.5 medium प्रकाशन: 2026-02-12 Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 4.7 4.4
क्रमांक #151 #160
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 6.5 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 46.0% 28.6%
अस्थिर चाचण्या 9 0
एकूण रन 63 54
प्रति निकाल खर्च 7.900 1.570
एकूण खर्च $0.164 $0.057
इनपुट किंमत $0.120 / 1M $1.250 / 1M
आउटपुट किंमत $0.480 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 43,706 41,313
आउटपुट टोकन्स 109,495 1,923
रिझनिंग टोकन्स 330,814 0
प्रतिसाद वेळ (सरासरी) 65.37s 1.11s
प्रतिसाद वेळ (कमाल) 251.36s 6.04s
प्रतिसाद वेळ (एकूण) 849.76s 19.96s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 MiniMax M2.5

medium
अवैध SVG
खर्च
$0.000
वेळ
300.0s
टोकन्स
0 tok

#160 xAI: Grok 4.20

none
खर्च
$0.004
वेळ
6.5s
टोकन्स
1,367 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 612 286 45,344
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 3.4 9.1 0.0% 0 188.58s 6,076 357 106,177
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 21,104 740 9,713
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 6,584 266 3,835
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 308 105,047 133,487
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 492 25 1,686
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 7.5 10.0 50.0% 0 621ms 699 156 1,495
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 5.3 7.2 44.4% 1 11.21s 495 1,069 9,605
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 7,123 269 937
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 213 1,280 18,535
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

झटपट तुलना

तुलना जोडी बदला