नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs StepFun: Step 3.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Qwen3.6 Max Preview Qwen3.6 Max Preview none प्रकाशन: 2026-04-20 Step 3.7 Flash Step 3.7 Flash high प्रकाशन: 2026-05-29
स्कोअर 7.1 7.1
क्रमांक #76 #74
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 61.7% 65.8%
अस्थिर चाचण्या 2 4
एकूण रन 60 60
प्रति निकाल खर्च 0.797 8.723
एकूण खर्च $0.088 $0.960
इनपुट किंमत $1.040 / 1M $0.200 / 1M
आउटपुट किंमत $6.240 / 1M $1.150 / 1M
आउटपुट टोकन्स 4,773 828,084
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 3.31s 49.43s
प्रतिसाद वेळ (कमाल) 20.51s 192.75s
प्रतिसाद वेळ (एकूण) 66.17s 988.58s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 4.2 6.0 33.3% 1 3.06s 450 0
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 69 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 321 0
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 19 0
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

झटपट तुलना

तुलना जोडी बदला