नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs StepFun: Step 3.5 Flash

सारांश

Qwen3.6 Max Preview vs Step 3.5 Flash benchmark तुलना: Step 3.5 Flash average score मध्ये पुढे आहे: 6.6 vs 6.0. Step 3.5 Flash चा benchmark खर्च कमी आहे: $0.070 vs $0.075. Qwen3.6 Max Preview वेगवान आहे: 3.30s vs 72.53s, pass rates 58.7% vs 54.0%.

शिफारस केलेले मॉडेल: Qwen3.6 Max Preview - Its score stays close to the best score here (6.0 vs 6.6), while responding about 21.9x faster than Step 3.5 Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Qwen3.6 Max Preview Qwen3.6 Max Preview none प्रकाशन: 2026-04-20 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01
स्कोअर 6.0 6.6
क्रमांक #100 #80
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 8.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 58.7% 54.0%
अस्थिर चाचण्या 2 1
एकूण रन 63 60
प्रति निकाल खर्च 0.824 0.198
एकूण खर्च $0.075 $0.070
इनपुट किंमत $1.040 / 1M $0.090 / 1M
आउटपुट किंमत $6.240 / 1M $0.300 / 1M
एकूण इनपुट टोकन्स 42,509 34,431
आउटपुट टोकन्स 4,779 91,587
रिझनिंग टोकन्स 0 195,973
प्रतिसाद वेळ (सरासरी) 3.30s 72.53s
प्रतिसाद वेळ (कमाल) 20.51s 453.94s
प्रतिसाद वेळ (एकूण) 69.40s 1015.47s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#100 Qwen3.6 Max Preview

none
खर्च
$0.025
वेळ
83.9s
टोकन्स
4,066 tok

#80 Step 3.5 Flash

medium
खर्च
$0.008
वेळ
277.1s
टोकन्स
23,695 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 694 20,391 24,176
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
Step 3.5 Flash 2.4 5.2 0.0% 0 258.38s 2,211 13,207 22,429
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 13,638 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 7,368 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 673 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 509 240 3,506
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 705 2,364 3,521
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 711 5,630 10,861
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 7,701 275 3,802
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 221 2,354 10,372

झटपट तुलना

तुलना जोडी बदला