नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.5 Plus 2026-02-15 vs StepFun: Step 3.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium रिलीज़: 2026-02-15 Step 3.7 Flash Step 3.7 Flash medium रिलीज़: 2026-05-29
स्कोर 8.1 7.9
रैंक #23 #32
विश्वसनीयता 10.0 9.9
संगति 8.8 9.2
सही परीक्षण
प्रति प्रयास पास दर 76.7% 71.7%
अस्थिर टेस्ट 3 2
कुल रन 60 58
प्रति परिणाम लागत 2.251 2.663
कुल लागत $0.316 $0.347
इनपुट कीमत $0.260 / 1M $0.200 / 1M
आउटपुट कीमत $1.560 / 1M $1.150 / 1M
आउटपुट टोकन 2,145 294,481
रीजनिंग टोकन 172,563 0
प्रतिक्रिया समय (औसत) 67.58s 18.32s
प्रतिक्रिया समय (अधिकतम) 266.69s 113.98s
प्रतिक्रिया समय (कुल) 878.57s 366.45s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 205 21,236
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 32,185 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 7.6 6.7 66.7% 1 193.80s 406 63,554
Step 3.7 Flash 8.2 6.7 83.3% 1 10.64s 19,320 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 7,106 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 270 14,916
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 3,020 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 35 16,680
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 70,347 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 73 8,675
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 3,987 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 2,166 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 301 13,853
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 15,071 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 2,115 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 24 17,130
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 139,164 0

त्वरित तुलना

तुलना जोड़ी बदलें