नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs StepFun: Step 3.7 Flash

सारांश

GPT-5.4 Mini vs Step 3.7 Flash benchmark तुलना: Step 3.7 Flash average score मध्ये पुढे आहे: 8.5 vs 8.0. Step 3.7 Flash चा benchmark खर्च कमी आहे: $0.376 vs $0.526. Step 3.7 Flash वेगवान आहे: 20.35s vs 22.34s, pass rates 73.0% vs 73.0%.

शिफारस केलेले मॉडेल: Step 3.7 Flash - It has the strongest score in this comparison (8.5) and the best overall balance of cost and response time across all 2 models.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium प्रकाशन: 2026-03-17 Step 3.7 Flash Step 3.7 Flash medium प्रकाशन: 2026-05-29
स्कोअर 8.0 8.5
क्रमांक #30 #23
विश्वसनीयता 10.0 9.9
सुसंगतता 8.0 9.3
बरोबर चाचण्या
प्रति प्रयत्न पास दर 73.0% 73.0%
अस्थिर चाचण्या 5 2
एकूण रन 63 61
प्रति निकाल खर्च 4.381 2.686
एकूण खर्च $0.526 $0.376
इनपुट किंमत $0.750 / 1M $0.200 / 1M
आउटपुट किंमत $4.500 / 1M $1.150 / 1M
एकूण इनपुट टोकन्स 34,116 39,981
आउटपुट टोकन्स 2,181 319,958
रिझनिंग टोकन्स 108,937 0
प्रतिसाद वेळ (सरासरी) 22.34s 20.35s
प्रतिसाद वेळ (कमाल) 138.75s 113.98s
प्रतिसाद वेळ (एकूण) 469.20s 427.42s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

#23 Step 3.7 Flash

medium
Cost
$0.006
Time
46.2s
Tokens
4,466 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 756 32,185 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
Step 3.7 Flash 8.8 7.8 88.9% 1 27.42s 7,437 44,797 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 13,683 7,106 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 7,398 3,020 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 708 70,347 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 525 3,987 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 735 2,166 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 756 15,071 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 7,746 2,115 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 237 139,164 0

झटपट तुलना

तुलना जोडी बदला