नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs StepFun: Step 3.5 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-11

मेट्रिक Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium प्रकाशन: 2026-02-19 Step 3.5 Flash Step 3.5 Flash none प्रकाशन: 2026-02-01
स्कोअर 9.6 3.0
क्रमांक #2 #93
सुसंगतता 10.0 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 94.4% 0.0%
अस्थिर चाचण्या 0 0
एकूण रन 54 3
प्रति निकाल खर्च 3.400 0.000
एकूण खर्च $0.578 $0.000
???? ??? $2.000 / 1M $0.100 / 1M
????? ??? $12.000 / 1M $0.300 / 1M
आउटपुट टोकन्स 1,932 0
रिझनिंग टोकन्स 40,542 0
प्रतिसाद वेळ (सरासरी) 15.96s 0ms
प्रतिसाद वेळ (कमाल) 40.61s 0ms
प्रतिसाद वेळ (एकूण) 175.52s 0ms

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Step 3.5 Flash - - - - - - - -
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Step 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Step 3.5 Flash - - - - - - - -
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Step 3.5 Flash - - - - - - - -
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Step 3.5 Flash - - - - - - - -
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Step 3.5 Flash - - - - - - - -
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Step 3.5 Flash - - - - - - - -
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Step 3.5 Flash - - - - - - - -
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Step 3.5 Flash - - - - - - - -

झटपट तुलना

तुलना जोडी बदला