नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.7 Plus vs StepFun: Step 3.7 Flash

सारांश

Qwen3.7 Plus vs Step 3.7 Flash benchmark तुलना: Qwen3.7 Plus average score मध्ये पुढे आहे: 7.2 vs 7.1. Qwen3.7 Plus चा benchmark खर्च कमी आहे: $0.023 vs $1.148. Qwen3.7 Plus वेगवान आहे: 2.85s vs 64.46s, pass rates 47.6% vs 63.5%.

शिफारस केलेले मॉडेल: Qwen3.7 Plus - It has the best score here (7.2), while costing about 52.1x less than Step 3.7 Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Qwen3.7 Plus Qwen3.7 Plus none प्रकाशन: 2026-06-03 Step 3.7 Flash Step 3.7 Flash high प्रकाशन: 2026-05-29
स्कोअर 7.2 7.1
क्रमांक #61 #63
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 47.6% 63.5%
अस्थिर चाचण्या 0 4
एकूण रन 63 63
प्रति निकाल खर्च 0.276 10.434
एकूण खर्च $0.023 $1.148
इनपुट किंमत $0.320 / 1M $0.200 / 1M
आउटपुट किंमत $1.280 / 1M $1.150 / 1M
एकूण इनपुट टोकन्स 42,510 38,391
आउटपुट टोकन्स 6,578 991,355
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 2.85s 64.46s
प्रतिसाद वेळ (कमाल) 29.38s 364.99s
प्रतिसाद वेळ (एकूण) 59.86s 1353.57s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Qwen3.7 Plus

none
Cost
$0.019
Time
213.5s
Tokens
11,960 tok

#63 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

झटपट तुलना

तुलना जोडी बदला