नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

MiniMax: MiniMax M2.5 vs OpenAI: gpt-oss-120b

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक MiniMax M2.5 MiniMax M2.5 medium रिलीज़: 2026-02-12 निःशुल्क उपलब्ध gpt-oss-120b gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध
स्कोर 5.7 5.8
रैंक #94 #88
विश्वसनीयता लागू नहीं लागू नहीं
संगति 5.6 7.2
सही परीक्षण
प्रति प्रयास पास दर 57.4% 51.9%
अस्थिर टेस्ट 10 6
कुल रन 54 54
प्रति परिणाम लागत 4.987 0.144
कुल लागत $0.250 $0.011
???? ??? $0.150 / 1M $0.000 / 1M
????? ??? $1.150 / 1M $0.000 / 1M
आउटपुट टोकन 107,044 13,493
रीजनिंग टोकन 206,422 36,879
प्रतिक्रिया समय (औसत) 39.65s 16.08s
प्रतिक्रिया समय (अधिकतम) 237.27s 50.92s
प्रतिक्रिया समय (कुल) 396.47s 176.88s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 286 45,344
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.0 10.0 0.0% 0 0ms 0 0
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 740 9,713
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 266 3,835
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 105,047 133,487
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 25 1,686
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 8.1 6.8 83.3% 1 4.64s 252 1,873
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 5.3 7.2 44.4% 1 11.54s 159 9,547
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083

त्वरित तुलना

तुलना जोड़ी बदलें