नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

तुलना किए गए मॉडल

सारांश

MiniMax M3 vs MiniMax M2.7 vs MiniMax M2.5 benchmark तुलनाMiniMax M3 स्कोर में 7.6 के साथ आगे है। MiniMax M2.7 विश्वसनीयता में 10.0 के साथ आगे है। MiniMax M2.7 का कुल लागत सबसे कम है: $0.104. MiniMax M2.7 38.18s पर सबसे तेज है।

अनुशंसित मॉडल: MiniMax M3 - It has the best score here (7.6), while costing about 1.6x less than इस तुलना के बाकी मॉडल.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक MiniMax M3 MiniMax M3 medium रिलीज़: 2026-06-01 MiniMax M2.7 MiniMax M2.7 medium रिलीज़: 2026-03-18 MiniMax M2.5 MiniMax M2.5 medium रिलीज़: 2026-02-12
स्कोर 7.6 5.2 4.7
रैंक #43 #134 #151
विश्वसनीयता 9.6 10.0 10.0
संगति 7.9 6.8 6.5
सही परीक्षण
प्रति प्रयास पास दर 65.1% 46.0% 46.0%
अस्थिर टेस्ट 5 8 9
कुल रन 63 63 63
प्रति परिणाम लागत 1.187 2.494 7.900
कुल लागत $0.131 $0.104 $0.303
इनपुट कीमत $0.300 / 1M $0.250 / 1M $0.150 / 1M
आउटपुट कीमत $1.200 / 1M $1.000 / 1M $0.900 / 1M
कुल इनपुट टोकन 46,546 34,371 43,706
आउटपुट टोकन 49,036 8,981 109,495
रीजनिंग टोकन 92,543 89,812 330,814
प्रतिक्रिया समय (औसत) 68.17s 38.18s 65.37s
प्रतिक्रिया समय (अधिकतम) 431.03s 196.21s 251.36s
प्रतिक्रिया समय (कुल) 1363.38s 763.60s 849.76s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#43 MiniMax M3

medium
Cost
$0.012
Time
154.4s
Tokens
10,018 tok

#134 MiniMax M2.7

medium
Cost
$0.022
Time
22.8s
Tokens
9,250 tok

#151 MiniMax M2.5

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 5.5 3.7 66.7% 3 14.95s 2,526 874 3,414
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 612 286 45,344
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 6.1 6.5 55.6% 1 144.74s 5,804 6,223 32,667
MiniMax M2.7 5.7 9.1 33.3% 0 101.89s 2,961 1,231 38,841
MiniMax M2.5 3.4 9.1 0.0% 0 188.58s 6,076 357 106,177
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 10.0 10.0 100.0% 0 65.30s 14,760 1,306 6,253
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 21,104 740 9,713
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 10.0 10.0 100.0% 0 14.92s 8,088 514 3,164
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 6,584 266 3,835
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 5.5 9.3 33.3% 0 233.13s 869 16,254 19,070
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 308 105,047 133,487
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 5.1 3.4 33.3% 1 33.25s 954 2,487 2,523
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 492 25 1,686
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 9.8 10.0 100.0% 0 6.14s 1,623 103 920
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
MiniMax M2.5 7.5 10.0 50.0% 0 621ms 699 156 1,495
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 7.9 9.9 66.7% 0 49.91s 2,079 11,946 13,761
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
MiniMax M2.5 5.3 7.2 44.4% 1 11.21s 495 1,069 9,605
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 10.0 10.0 100.0% 0 11.91s 9,168 281 555
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 7,123 269 937
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
MiniMax M3 3.0 10.0 0.0% 0 100.80s 675 9,048 10,216
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 213 1,280 18,535

त्वरित तुलना

तुलना जोड़ी बदलें