नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs StepFun: Step 3.5 Flash

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक DeepSeek: DeepSeek V3.2 none प्रकाशन: 2025-12-01 StepFun: Step 3.5 Flash medium प्रकाशन: 2026-02-01 मोफत उपलब्ध
क्रमांक #33 #13
सरासरी स्कोअर 5.5 7.4
सुसंगतता 8.4 9.1
प्रति निकाल खर्च 0.220 0.000
एकूण खर्च $0.016 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 54.2% 68.8%
अस्थिर चाचण्या 3 2
एकूण रन 48 48
आउटपुट टोकन्स 7,823 71,452
रिझनिंग टोकन्स 0 155,147
प्रतिसाद वेळ (सरासरी) 12.86s 29.10s
प्रतिसाद वेळ (कमाल) 115.89s 170.45s
प्रतिसाद वेळ (एकूण) 205.78s 290.96s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek: DeepSeek V3.2 10.0 9.7 0.0% 0 8.79s 1,411 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek: DeepSeek V3.2 8.0 10.0 0.0% 0 115.89s 2,887 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek: DeepSeek V3.2 5.4 5.8 66.7% 1 9.42s 1,710 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek: DeepSeek V3.2 10.0 7.2 22.2% 1 1.61s 24 0
StepFun: Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek: DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
StepFun: Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek: DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
StepFun: Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek: DeepSeek V3.2 7.7 7.5 88.9% 1 7.37s 1,136 0
StepFun: Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek: DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

झटपट तुलना

तुलना जोडी बदला