नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs StepFun: Step 3.5 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-10

मेट्रिक Qwen3.6 Max Preview Qwen3.6 Max Preview none प्रकाशन: 2026-04-20 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01
स्कोअर 7.2 7.6
क्रमांक #54 #43
विश्वसनीयता 10.0 10.0
सुसंगतता 9.1 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 64.9% 66.7%
अस्थिर चाचण्या 2 2
एकूण रन 57 54
प्रति निकाल खर्च 0.755 0.099
एकूण खर्च $0.083 $0.011
???? ??? $1.040 / 1M $0.100 / 1M
????? ??? $6.240 / 1M $0.300 / 1M
आउटपुट टोकन्स 4,751 78,299
रिझनिंग टोकन्स 0 173,409
प्रतिसाद वेळ (सरासरी) 3.31s 41.66s
प्रतिसाद वेळ (कमाल) 20.51s 170.45s
प्रतिसाद वेळ (एकूण) 62.80s 499.91s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 20,391 24,176
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
Step 3.5 Flash - - - - - - - -
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 240 3,506
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.45s 69 0
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 19 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 2,354 10,372

झटपट तुलना

तुलना जोडी बदला