नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs StepFun: Step 3.7 Flash

सारांश

Qwen3.5 Plus 2026-02-15 vs Step 3.7 Flash benchmark तुलना: Qwen3.5 Plus 2026-02-15 average score मध्ये पुढे आहे: 8.0 vs 7.1. Qwen3.5 Plus 2026-02-15 चा benchmark खर्च कमी आहे: $0.310 vs $1.148. Step 3.7 Flash वेगवान आहे: 64.46s vs 73.79s, pass rates 73.0% vs 63.5%.

शिफारस केलेले मॉडेल: Qwen3.5 Plus 2026-02-15 - It has the best score here (8.0), while costing about 3.7x less than Step 3.7 Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium प्रकाशन: 2026-02-15 Step 3.7 Flash Step 3.7 Flash high प्रकाशन: 2026-05-29
स्कोअर 8.0 7.1
क्रमांक #28 #63
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 73.0% 63.5%
अस्थिर चाचण्या 3 4
एकूण रन 63 63
प्रति निकाल खर्च 2.445 10.434
एकूण खर्च $0.310 $1.148
इनपुट किंमत $0.260 / 1M $0.200 / 1M
आउटपुट किंमत $1.560 / 1M $1.150 / 1M
एकूण इनपुट टोकन्स 40,918 38,391
आउटपुट टोकन्स 2,159 991,355
रिझनिंग टोकन्स 189,604 0
प्रतिसाद वेळ (सरासरी) 73.79s 64.46s
प्रतिसाद वेळ (कमाल) 266.69s 364.99s
प्रतिसाद वेळ (एकूण) 1033.07s 1353.57s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#28 Qwen3.5 Plus 2026-02-15

medium
खर्च
$0.011
वेळ
125.5s
टोकन्स
7,040 tok

#63 Step 3.7 Flash

high
खर्च
$0.007
वेळ
63.6s
टोकन्स
6,030 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 672 205 21,236
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 6.6 7.1 44.4% 1 180.70s 6,950 420 80,595
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 14,934 421 7,906
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 7,782 270 14,916
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 444 35 16,680
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 344 73 8,675
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 699 101 7,704
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 696 301 13,853
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 8,193 309 909
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 204 24 17,130
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

झटपट तुलना

तुलना जोडी बदला