नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MiniMax: MiniMax M2.7 vs StepFun: Step 3.5 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-18

मेट्रिक MiniMax M2.7 MiniMax M2.7 medium प्रकाशन: 2026-03-18 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01 मोफत उपलब्ध
स्कोअर 5.0 7.9
क्रमांक #64 #22
सुसंगतता 5.3 9.1
बरोबर चाचण्या
प्रति प्रयत्न पास दर 49.0% 70.6%
अस्थिर चाचण्या 10 2
एकूण रन 51 49
प्रति निकाल खर्च 2.398 0.000
एकूण खर्च $0.072 $0.000
???? ??? $0.300 / 1M $0.000 / 1M
????? ??? $1.200 / 1M $0.000 / 1M
आउटपुट टोकन्स 4,517 71,904
रिझनिंग टोकन्स 47,612 155,607
प्रतिसाद वेळ (सरासरी) 27.32s 26.78s
प्रतिसाद वेळ (कमाल) 117.04s 170.45s
प्रतिसाद वेळ (एकूण) 437.10s 294.58s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 3,010 17,716
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 369 4,480
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 187 5,882
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 8 2,796
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 92 5,204
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.7 3.7 1.8 50.0% 2 12.64s 213 2,457
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.7 3.8 4.5 33.3% 2 25.62s 334 8,076
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 304 1,001
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

झटपट तुलना

तुलना जोडी बदला