नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Qwen3.6 Plus Preview vs StepFun: Step 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-30

मेट्रिक Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium रिलीज़: रिलीज़ तिथि अज्ञात निःशुल्क उपलब्ध Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01 निःशुल्क उपलब्ध
स्कोर 8.5 7.9
रैंक #6 #25
संगति 10.0 9.1
सही परीक्षण
प्रति प्रयास पास दर 76.5% 70.6%
अस्थिर टेस्ट 0 2
कुल रन 49 49
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.000 / 1M $0.100 / 1M
????? ??? $0.000 / 1M $0.300 / 1M
आउटपुट टोकन 1,756 71,904
रीजनिंग टोकन 77,213 155,607
प्रतिक्रिया समय (औसत) 13.94s 26.78s
प्रतिक्रिया समय (अधिकतम) 43.55s 170.45s
प्रतिक्रिया समय (कुल) 237.01s 294.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 9.90s 207 7,557
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 5.1 10.0 0.0% 0 27.05s 111 5,232
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.54s 102 5,552
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 6.11s 298 6,868
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

त्वरित तुलना

तुलना जोड़ी बदलें