नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

MiniMax: MiniMax M2.7 vs xAI: Grok 4.20

सारांश

MiniMax M2.7 vs Grok 4.20 benchmark तुलना: MiniMax M2.7 average score में आगे है: 5.2 vs 4.4. Grok 4.20 की benchmark लागत कम है: $0.057 vs $0.075. Grok 4.20 तेज है: 1.11s vs 38.18s, pass rates 46.0% vs 28.6%.

अनुशंसित मॉडल: MiniMax M2.7 - It has the strongest score in this comparison (5.2) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक MiniMax M2.7 MiniMax M2.7 medium रिलीज़: 2026-03-18 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.2 4.4
रैंक #132 #160
विश्वसनीयता 10.0 लागू नहीं
संगति 6.8 8.5
सही परीक्षण
प्रति प्रयास पास दर 46.0% 28.6%
अस्थिर टेस्ट 8 0
कुल रन 63 54
प्रति परिणाम लागत 2.494 1.570
कुल लागत $0.075 $0.057
इनपुट कीमत $0.180 / 1M $1.250 / 1M
आउटपुट कीमत $0.720 / 1M $2.500 / 1M
कुल इनपुट टोकन 34,371 41,313
आउटपुट टोकन 8,981 1,923
रीजनिंग टोकन 89,812 0
प्रतिक्रिया समय (औसत) 38.18s 1.11s
प्रतिक्रिया समय (अधिकतम) 196.21s 6.04s
प्रतिक्रिया समय (कुल) 763.60s 19.96s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#132 MiniMax M2.7

medium
लागत
$0.022
समय
22.8s
टोकन
9,250 tok

#160 xAI: Grok 4.20

none
लागत
$0.004
समय
6.5s
टोकन
1,367 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 5.7 9.1 33.3% 0 101.89s 2,961 1,231 38,841
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

त्वरित तुलना

तुलना जोड़ी बदलें