नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs StepFun: Step 3.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 Step 3.7 Flash Step 3.7 Flash low रिलीज़: 2026-05-29
स्कोर 7.4 7.4
रैंक #57 #60
विश्वसनीयता 10.0 10.0
संगति 8.4 8.7
सही परीक्षण
प्रति प्रयास पास दर 68.3% 68.3%
अस्थिर टेस्ट 4 3
कुल रन 60 60
प्रति परिणाम लागत 3.350 2.796
कुल लागत $0.402 $0.336
इनपुट कीमत $1.750 / 1M $0.200 / 1M
आउटपुट कीमत $14.000 / 1M $1.150 / 1M
आउटपुट टोकन 24,757 285,209
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 6.13s 16.06s
प्रतिक्रिया समय (अधिकतम) 18.33s 124.75s
प्रतिक्रिया समय (कुल) 122.61s 321.11s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.9 6.2 66.7% 1 10.52s 4,772 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 1,491 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 1,758 0
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 569 0
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

त्वरित तुलना

तुलना जोड़ी बदलें