नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

MiniMax: MiniMax M2.5 vs xAI: Grok 4.20

सारांश

MiniMax M2.5 vs Grok 4.20 benchmark तुलना: MiniMax M2.5 average score में आगे है: 4.7 vs 4.4. Grok 4.20 की benchmark लागत कम है: $0.057 vs $0.164. Grok 4.20 तेज है: 1.11s vs 65.37s, pass rates 46.0% vs 28.6%.

अनुशंसित मॉडल: Grok 4.20 - Its score stays close to the best score here (4.4 vs 4.7), while costing about 2.9x less than MiniMax M2.5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक MiniMax M2.5 MiniMax M2.5 medium रिलीज़: 2026-02-12 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 4.7 4.4
रैंक #151 #160
विश्वसनीयता 10.0 लागू नहीं
संगति 6.5 8.5
सही परीक्षण
प्रति प्रयास पास दर 46.0% 28.6%
अस्थिर टेस्ट 9 0
कुल रन 63 54
प्रति परिणाम लागत 7.900 1.570
कुल लागत $0.164 $0.057
इनपुट कीमत $0.120 / 1M $1.250 / 1M
आउटपुट कीमत $0.480 / 1M $2.500 / 1M
कुल इनपुट टोकन 43,706 41,313
आउटपुट टोकन 109,495 1,923
रीजनिंग टोकन 330,814 0
प्रतिक्रिया समय (औसत) 65.37s 1.11s
प्रतिक्रिया समय (अधिकतम) 251.36s 6.04s
प्रतिक्रिया समय (कुल) 849.76s 19.96s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 MiniMax M2.5

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#160 xAI: Grok 4.20

none
लागत
$0.004
समय
6.5s
टोकन
1,367 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 612 286 45,344
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.4 9.1 0.0% 0 188.58s 6,076 357 106,177
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 21,104 740 9,713
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 6,584 266 3,835
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 308 105,047 133,487
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 492 25 1,686
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 7.5 10.0 50.0% 0 621ms 699 156 1,495
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 5.3 7.2 44.4% 1 11.21s 495 1,069 9,605
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 7,123 269 937
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 213 1,280 18,535
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

त्वरित तुलना

तुलना जोड़ी बदलें