नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs StepFun: Step 3.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low प्रकाशन: 2026-03-03 Step 3.7 Flash Step 3.7 Flash medium प्रकाशन: 2026-05-29
स्कोअर 7.6 7.9
क्रमांक #50 #32
विश्वसनीयता 10.0 9.9
सुसंगतता 10.0 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.0% 71.7%
अस्थिर चाचण्या 0 2
एकूण रन 60 58
प्रति निकाल खर्च 0.186 2.663
एकूण खर्च $0.025 $0.347
इनपुट किंमत $0.250 / 1M $0.200 / 1M
आउटपुट किंमत $1.500 / 1M $1.150 / 1M
आउटपुट टोकन्स 2,280 294,481
रिझनिंग टोकन्स 8,829 0
प्रतिसाद वेळ (सरासरी) 2.85s 18.32s
प्रतिसाद वेळ (कमाल) 11.91s 113.98s
प्रतिसाद वेळ (एकूण) 57.08s 366.45s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 32,185 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 1.56s 654 723
Step 3.7 Flash 8.2 6.7 83.3% 1 10.64s 19,320 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 7,106 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 3,020 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 70,347 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 3,987 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 2,166 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 243 1,248
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 15,071 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 2,115 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 9 420
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 139,164 0

झटपट तुलना

तुलना जोडी बदला