नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs StepFun: Step 3.5 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03

मेट्रिक Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low प्रकाशन: 2026-03-03 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01
स्कोअर 7.6 7.4
क्रमांक #44 #55
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 9.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.0% 59.7%
अस्थिर चाचण्या 0 1
एकूण रन 60 57
प्रति निकाल खर्च 0.186 0.133
एकूण खर्च $0.025 $0.062
इनपुट किंमत $0.250 / 1M $0.090 / 1M
आउटपुट किंमत $1.500 / 1M $0.300 / 1M
एकूण इनपुट टोकन्स 29,708 33,555
आउटपुट टोकन्स 2,280 90,478
रिझनिंग टोकन्स 8,829 173,544
प्रतिसाद वेळ (सरासरी) 2.85s 43.20s
प्रतिसाद वेळ (कमाल) 11.91s 170.45s
प्रतिसाद वेळ (एकूण) 57.08s 561.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 694 20,391 24,176
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 1.56s 5,131 654 723
Step 3.5 Flash 3.5 7.8 0.0% 0 62.83s 1,335 12,098 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 13,638 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 7,368 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 673 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 509 240 3,506
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 705 2,364 3,521
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 711 5,630 10,861
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 7,701 275 3,802
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 221 2,354 10,372

झटपट तुलना

तुलना जोडी बदला