नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.5-27B vs StepFun: Step 3.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-02

मेट्रिक Qwen3.5-27B Qwen3.5-27B medium रिलीज़: 2026-02-24 Step 3.7 Flash Step 3.7 Flash low रिलीज़: 2026-05-29
स्कोर 7.9 7.4
रैंक #27 #59
विश्वसनीयता 10.0 10.0
संगति 8.9 8.7
सही परीक्षण
प्रति प्रयास पास दर 73.3% 68.3%
अस्थिर टेस्ट 3 3
कुल रन 60 60
प्रति परिणाम लागत 4.532 2.796
कुल लागत $0.488 $0.336
इनपुट कीमत $0.195 / 1M $0.200 / 1M
आउटपुट कीमत $1.560 / 1M $1.150 / 1M
कुल इनपुट टोकन 39,329 37,458
आउटपुट टोकन 2,569 285,209
रीजनिंग टोकन 304,894 0
प्रतिक्रिया समय (औसत) 60.09s 16.06s
प्रतिक्रिया समय (अधिकतम) 177.36s 124.75s
प्रतिक्रिया समय (कुल) 1201.89s 321.11s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 672 569 31,505
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 7.0 9.8 50.0% 0 123.86s 5,060 416 64,993
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 4,794 14,569 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 14,946 483 9,991
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 7,782 270 16,150
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 553 43 52,368
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 524 70 23,147
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 699 97 11,638
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 8.2 7.7 77.8% 1 59.60s 696 242 70,096
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 8,193 348 1,323
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 3.0 10.0 0.0% 0 85.11s 204 31 23,683
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

त्वरित तुलना

तुलना जोड़ी बदलें