नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.7 Max vs StepFun: Step 3.5 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03

मेट्रिक Qwen3.7 Max Qwen3.7 Max none प्रकाशन: 2026-05-22 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01
स्कोअर 7.9 7.4
क्रमांक #26 #55
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 9.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.0% 59.7%
अस्थिर चाचण्या 0 1
एकूण रन 60 57
प्रति निकाल खर्च 0.719 0.133
एकूण खर्च $0.051 $0.062
इनपुट किंमत $1.250 / 1M $0.090 / 1M
आउटपुट किंमत $3.750 / 1M $0.300 / 1M
एकूण इनपुट टोकन्स 34,266 33,555
आउटपुट टोकन्स 1,988 90,478
रिझनिंग टोकन्स 0 173,544
प्रतिसाद वेळ (सरासरी) 1.30s 43.20s
प्रतिसाद वेळ (कमाल) 3.92s 170.45s
प्रतिसाद वेळ (एकूण) 25.95s 561.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 696 242 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 694 20,391 24,176
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 5,070 576 0
Step 3.5 Flash 3.5 7.8 0.0% 0 62.83s 1,335 12,098 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 9,549 171 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 13,638 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 7,794 243 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 7,368 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 789 15 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 673 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 522 120 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 509 240 3,506
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 711 72 0
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 705 2,364 3,521
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 714 314 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 711 5,630 10,861
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 8,211 222 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 7,701 275 3,802
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 210 13 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 221 2,354 10,372

झटपट तुलना

तुलना जोडी बदला