नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs StepFun: Step 3.5 Flash

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक OpenAI: GPT-5.3 Chat none प्रकाशन: 2026-03-03 StepFun: Step 3.5 Flash medium प्रकाशन: 2026-02-01 मोफत उपलब्ध
क्रमांक #19 #13
सरासरी स्कोअर 7.3 7.4
सुसंगतता 8.5 9.1
प्रति निकाल खर्च 3.163 0.000
एकूण खर्च $0.317 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.8% 68.8%
अस्थिर चाचण्या 3 2
एकूण रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन्स 19,272 71,452
रिझनिंग टोकन्स 0 155,147
प्रतिसाद वेळ (सरासरी) 5.96s 29.10s
प्रतिसाद वेळ (कमाल) 18.33s 170.45s
प्रतिसाद वेळ (एकूण) 95.30s 290.96s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
StepFun: Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
StepFun: Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
StepFun: Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
StepFun: Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

झटपट तुलना

तुलना जोडी बदला