नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-9B vs StepFun: Step 3.5 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Qwen3.5-9B Qwen3.5-9B none प्रकाशन: 2026-03-02 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01 मोफत उपलब्ध
क्रमांक #60 #14
सरासरी स्कोअर 3.4 7.4
सुसंगतता 10.0 9.1
प्रति निकाल खर्च 0.111 0.000
एकूण खर्च $0.005 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 25.0% 68.8%
अस्थिर चाचण्या 0 2
एकूण रन 48 48
आउटपुट टोकन्स 2,939 71,452
रिझनिंग टोकन्स 0 155,147
प्रतिसाद वेळ (सरासरी) 1.06s 29.10s
प्रतिसाद वेळ (कमाल) 5.91s 170.45s
प्रतिसाद वेळ (एकूण) 16.95s 290.96s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 9.9 0.0% 0 1.02s 576 0
Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 0.0% 0 5.91s 1,255 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 9.9 10.0 100.0% 0 847ms 249 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 0.0% 0 464ms 24 0
Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.0 9.9 0.0% 0 552ms 99 0
Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 5.5 10.0 50.0% 0 514ms 75 0
Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 9.9 0.0% 0 683ms 388 0
Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

झटपट तुलना

तुलना जोडी बदला