नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen3.6 Plus vs StepFun: Step 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01 निःशुल्क उपलब्ध
स्कोर 8.4 7.9
रैंक #9 #27
संगति 9.5 9.1
सही परीक्षण
प्रति प्रयास पास दर 78.4% 70.6%
अस्थिर टेस्ट 1 2
कुल रन 51 49
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.000 / 1M $0.100 / 1M
????? ??? $0.000 / 1M $0.300 / 1M
आउटपुट टोकन 1,763 71,904
रीजनिंग टोकन 83,782 155,607
प्रतिक्रिया समय (औसत) 15.27s 26.78s
प्रतिक्रिया समय (अधिकतम) 43.55s 170.45s
प्रतिक्रिया समय (कुल) 259.55s 294.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 207 7,557
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 452 13,073
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 270 10,706
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 56 33,464
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 111 5,232
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 102 5,552
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.11s 298 6,868
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 267 1,330
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

त्वरित तुलना

तुलना जोड़ी बदलें