नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.7 Max vs StepFun: Step 3.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Qwen3.7 Max Qwen3.7 Max none प्रकाशन: 2026-05-22 Step 3.7 Flash Step 3.7 Flash medium प्रकाशन: 2026-05-29
स्कोअर 7.9 7.9
क्रमांक #29 #32
विश्वसनीयता 10.0 9.9
सुसंगतता 10.0 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.0% 71.7%
अस्थिर चाचण्या 0 2
एकूण रन 60 58
प्रति निकाल खर्च 0.719 2.663
एकूण खर्च $0.101 $0.347
इनपुट किंमत $1.250 / 1M $0.200 / 1M
आउटपुट किंमत $3.750 / 1M $1.150 / 1M
आउटपुट टोकन्स 1,988 294,481
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.30s 18.32s
प्रतिसाद वेळ (कमाल) 3.92s 113.98s
प्रतिसाद वेळ (एकूण) 25.95s 366.45s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 242 0
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 32,185 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 576 0
Step 3.7 Flash 8.2 6.7 83.3% 1 10.64s 19,320 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 171 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 7,106 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 243 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 3,020 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 15 0
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 70,347 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 120 0
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 3,987 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 72 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 2,166 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 314 0
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 15,071 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 222 0
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 2,115 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 13 0
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 139,164 0

झटपट तुलना

तुलना जोडी बदला