नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs StepFun: Step 3.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-01

मेट्रिक Gemini 2.5 Flash Gemini 2.5 Flash medium प्रकाशन: 2025-06-17 Step 3.7 Flash Step 3.7 Flash high प्रकाशन: 2026-05-29
स्कोअर 7.7 7.1
क्रमांक #40 #74
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.3% 65.0%
अस्थिर चाचण्या 1 4
एकूण रन 60 60
प्रति निकाल खर्च 2.750 8.723
एकूण खर्च $0.358 $0.960
इनपुट किंमत $0.300 / 1M $0.200 / 1M
आउटपुट किंमत $2.500 / 1M $1.150 / 1M
आउटपुट टोकन्स 1,924 828,084
रिझनिंग टोकन्स 137,255 0
प्रतिसाद वेळ (सरासरी) 15.57s 49.43s
प्रतिसाद वेळ (कमाल) 95.48s 192.75s
प्रतिसाद वेळ (एकूण) 311.47s 988.58s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 6.6 10.0 50.0% 0 54.56s 537 24,413
Step 3.7 Flash 3.2 4.6 16.7% 1 126.82s 164,069 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 126 2,499
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 11 919
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

झटपट तुलना

तुलना जोडी बदला