नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 Nano vs StepFun: Step 3.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक GPT-5.4 Nano GPT-5.4 Nano medium रिलीज़: 2026-03-17 Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29
स्कोर 7.2 7.1
रैंक #72 #74
विश्वसनीयता 10.0 10.0
संगति 8.8 8.2
सही परीक्षण
प्रति प्रयास पास दर 63.3% 65.8%
अस्थिर टेस्ट 3 4
कुल रन 60 60
प्रति परिणाम लागत 0.900 8.723
कुल लागत $0.099 $0.960
इनपुट कीमत $0.200 / 1M $0.200 / 1M
आउटपुट कीमत $1.250 / 1M $1.150 / 1M
आउटपुट टोकन 2,993 828,084
रीजनिंग टोकन 70,928 0
प्रतिक्रिया समय (औसत) 11.79s 49.43s
प्रतिक्रिया समय (अधिकतम) 94.06s 192.75s
प्रतिक्रिया समय (कुल) 235.81s 988.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 6.8 6.2 66.7% 1 21.10s 495 15,186
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 594 1,408
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 70 1,174
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

त्वरित तुलना

तुलना जोड़ी बदलें