नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.5 Plus 2026-02-15 vs StepFun: Step 3.7 Flash

सारांश

Qwen3.5 Plus 2026-02-15 vs Step 3.7 Flash benchmark तुलना: Qwen3.5 Plus 2026-02-15 average score में आगे है: 8.0 vs 7.1. Qwen3.5 Plus 2026-02-15 की benchmark लागत कम है: $0.310 vs $1.148. Step 3.7 Flash तेज है: 64.46s vs 73.79s, pass rates 73.0% vs 63.5%.

अनुशंसित मॉडल: Qwen3.5 Plus 2026-02-15 - It has the best score here (8.0), while costing about 3.7x less than Step 3.7 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium रिलीज़: 2026-02-15 Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29
स्कोर 8.0 7.1
रैंक #28 #63
विश्वसनीयता 10.0 10.0
संगति 8.8 8.2
सही परीक्षण
प्रति प्रयास पास दर 73.0% 63.5%
अस्थिर टेस्ट 3 4
कुल रन 63 63
प्रति परिणाम लागत 2.445 10.434
कुल लागत $0.310 $1.148
इनपुट कीमत $0.260 / 1M $0.200 / 1M
आउटपुट कीमत $1.560 / 1M $1.150 / 1M
कुल इनपुट टोकन 40,918 38,391
आउटपुट टोकन 2,159 991,355
रीजनिंग टोकन 189,604 0
प्रतिक्रिया समय (औसत) 73.79s 64.46s
प्रतिक्रिया समय (अधिकतम) 266.69s 364.99s
प्रतिक्रिया समय (कुल) 1033.07s 1353.57s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#28 Qwen3.5 Plus 2026-02-15

medium
लागत
$0.011
समय
125.5s
टोकन
7,040 tok

#63 Step 3.7 Flash

high
लागत
$0.007
समय
63.6s
टोकन
6,030 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 672 205 21,236
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 6.6 7.1 44.4% 1 180.70s 6,950 420 80,595
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 14,934 421 7,906
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 7,782 270 14,916
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 444 35 16,680
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 344 73 8,675
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 699 101 7,704
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 696 301 13,853
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 8,193 309 909
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 204 24 17,130
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

त्वरित तुलना

तुलना जोड़ी बदलें