नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs StepFun: Step 3.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक GPT-5.3-Codex GPT-5.3-Codex medium प्रकाशन: 2026-02-05 Step 3.7 Flash Step 3.7 Flash low प्रकाशन: 2026-05-29
स्कोअर 8.3 7.4
क्रमांक #17 #60
विश्वसनीयता 10.0 10.0
सुसंगतता 8.4 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 81.7% 68.3%
अस्थिर चाचण्या 4 3
एकूण रन 60 60
प्रति निकाल खर्च 4.887 2.796
एकूण खर्च $0.685 $0.336
इनपुट किंमत $1.750 / 1M $0.200 / 1M
आउटपुट किंमत $14.000 / 1M $1.150 / 1M
आउटपुट टोकन्स 2,336 285,209
रिझनिंग टोकन्स 42,565 0
प्रतिसाद वेळ (सरासरी) 15.95s 16.06s
प्रतिसाद वेळ (कमाल) 100.93s 124.75s
प्रतिसाद वेळ (एकूण) 319.08s 321.11s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 18.45s 514 7,266
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.05s 356 1,593
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

झटपट तुलना

तुलना जोडी बदला