नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

MiniMax: MiniMax M2.5 vs OpenAI: GPT-5.5

सारांश

MiniMax M2.5 vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 4.7. MiniMax M2.5 की benchmark लागत कम है: $0.164 vs $0.907. GPT-5.5 तेज है: 9.76s vs 65.37s, pass rates 46.0% vs 85.7%.

अनुशंसित मॉडल: GPT-5.5 - It has the best score here (9.3), while responding about 6.7x faster than MiniMax M2.5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक MiniMax M2.5 MiniMax M2.5 medium रिलीज़: 2026-02-12 GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर 4.7 9.3
रैंक #151 #4
विश्वसनीयता 10.0 10.0
संगति 6.5 10.0
सही परीक्षण
प्रति प्रयास पास दर 46.0% 85.7%
अस्थिर टेस्ट 9 0
कुल रन 63 63
प्रति परिणाम लागत 7.900 5.035
कुल लागत $0.164 $0.907
इनपुट कीमत $0.120 / 1M $5.000 / 1M
आउटपुट कीमत $0.480 / 1M $30.000 / 1M
कुल इनपुट टोकन 43,706 34,209
आउटपुट टोकन 109,495 2,046
रीजनिंग टोकन 330,814 22,460
प्रतिक्रिया समय (औसत) 65.37s 9.76s
प्रतिक्रिया समय (अधिकतम) 251.36s 56.19s
प्रतिक्रिया समय (कुल) 849.76s 204.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 MiniMax M2.5

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#4 GPT-5.5

low
लागत
$0.068
समय
37.0s
टोकन
2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 612 286 45,344
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.4 9.1 0.0% 0 188.58s 6,076 357 106,177
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 21,104 740 9,713
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 6,584 266 3,835
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 308 105,047 133,487
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 492 25 1,686
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 7.5 10.0 50.0% 0 621ms 699 156 1,495
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 5.3 7.2 44.4% 1 11.21s 495 1,069 9,605
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 7,123 269 937
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 213 1,280 18,535
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

त्वरित तुलना

तुलना जोड़ी बदलें