नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

MiniMax: MiniMax M2.5 vs Qwen: Qwen3.5-9B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक MiniMax M2.5 MiniMax M2.5 medium रिलीज़: 2026-02-12 Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02
रैंक #49 #60
औसत स्कोर 4.7 3.4
संगति 5.6 10.0
प्रति परिणाम लागत 4.981 0.111
कुल लागत $0.250 $0.005
सही परीक्षण
प्रति प्रयास पास दर 60.4% 25.0%
अस्थिर टेस्ट 9 0
कुल रन 48 48
आउटपुट टोकन 107,044 2,939
रीजनिंग टोकन 206,190 0
प्रतिक्रिया समय (औसत) 43.03s 1.06s
प्रतिक्रिया समय (अधिकतम) 237.27s 5.91s
प्रतिक्रिया समय (कुल) 387.25s 16.95s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 9.3 7.9 88.9% 1 32.42s 286 45,112
Qwen3.5-9B 10.0 9.9 0.0% 0 1.02s 576 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 10.0 2.1 66.7% 1 60.39s 740 9,713
Qwen3.5-9B 10.0 10.0 0.0% 0 5.91s 1,255 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 10.0 1.7 66.7% 2 7.48s 266 3,835
Qwen3.5-9B 9.9 10.0 100.0% 0 847ms 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 10.0 4.4 22.2% 2 237.27s 105,047 133,487
Qwen3.5-9B 10.0 10.0 0.0% 0 464ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 3.0 2.5 33.3% 1 6.63s 25 1,686
Qwen3.5-9B 3.0 9.9 0.0% 0 552ms 99 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 8.0 6.8 83.3% 1 4.64s 252 1,873
Qwen3.5-9B 5.5 10.0 50.0% 0 514ms 75 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 4.0 7.2 44.4% 1 11.54s 159 9,547
Qwen3.5-9B 10.0 9.9 0.0% 0 683ms 388 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0

त्वरित तुलना

तुलना जोड़ी बदलें