नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Qwen: Qwen3.5 Plus 2026-02-15 vs StepFun: Step 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none रिलीज़: 2026-02-15 Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01
स्कोर 6.8 7.9
रैंक #48 #30
संगति 9.3 9.1
सही परीक्षण
प्रति प्रयास पास दर 53.7% 70.6%
अस्थिर टेस्ट 2 2
कुल रन 54 49
प्रति परिणाम लागत 0.182 0.000
कुल लागत $0.017 $0.000
???? ??? $0.260 / 1M $0.100 / 1M
????? ??? $1.560 / 1M $0.300 / 1M
आउटपुट टोकन 2,461 71,904
रीजनिंग टोकन 0 155,607
प्रतिक्रिया समय (औसत) 2.60s 26.78s
प्रतिक्रिया समय (अधिकतम) 6.65s 170.45s
प्रतिक्रिया समय (कुल) 31.23s 294.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 517 0
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 6.3 3.7 33.3% 1 3.63s 443 0
Step 3.5 Flash - - - - - - - -
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 314 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 243 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 17 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 117 0
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.82s 516 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

त्वरित तुलना

तुलना जोड़ी बदलें