नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs StepFun: Step 3.5 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none प्रकाशन: 2026-03-03 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01
स्कोअर 7.4 7.4
क्रमांक #53 #55
विश्वसनीयता 10.0 10.0
सुसंगतता 8.4 9.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.3% 59.7%
अस्थिर चाचण्या 4 1
एकूण रन 60 57
प्रति निकाल खर्च 3.350 0.133
एकूण खर्च $0.402 $0.062
इनपुट किंमत $1.750 / 1M $0.090 / 1M
आउटपुट किंमत $14.000 / 1M $0.300 / 1M
एकूण इनपुट टोकन्स 31,590 33,555
आउटपुट टोकन्स 24,757 90,478
रिझनिंग टोकन्स 0 173,544
प्रतिसाद वेळ (सरासरी) 6.13s 43.20s
प्रतिसाद वेळ (कमाल) 18.33s 170.45s
प्रतिसाद वेळ (एकूण) 122.61s 561.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 694 20,391 24,176
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 6.9 6.2 66.7% 1 10.52s 4,683 4,772 0
Step 3.5 Flash 3.5 7.8 0.0% 0 62.83s 1,335 12,098 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 13,638 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 7,368 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 673 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 509 240 3,506
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 705 2,364 3,521
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 711 5,630 10,861
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 7,701 275 3,802
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 221 2,354 10,372

झटपट तुलना

तुलना जोडी बदला