नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs StepFun: Step 3.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium प्रकाशन: 2026-03-03 Step 3.7 Flash Step 3.7 Flash low प्रकाशन: 2026-05-29
स्कोअर 7.7 7.4
क्रमांक #39 #60
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.0% 68.3%
अस्थिर चाचण्या 0 3
एकूण रन 60 60
प्रति निकाल खर्च 0.481 2.796
एकूण खर्च $0.063 $0.336
इनपुट किंमत $0.250 / 1M $0.200 / 1M
आउटपुट किंमत $1.500 / 1M $1.150 / 1M
आउटपुट टोकन्स 2,204 285,209
रिझनिंग टोकन्स 33,657 0
प्रतिसाद वेळ (सरासरी) 3.94s 16.06s
प्रतिसाद वेळ (कमाल) 14.93s 124.75s
प्रतिसाद वेळ (एकूण) 78.74s 321.11s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 9.1 10.0 75.0% 0 2.33s 570 4,305
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 3.98s 455 5,510
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 14.93s 327 7,347
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.29s 279 2,952
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 4.21s 18 5,325
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.16s 96 1,488
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.91s 72 2,121
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 5.30s 141 1,896
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.80s 234 912
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 2.68s 12 1,801
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

झटपट तुलना

तुलना जोडी बदला