नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite Preview vs StepFun: Step 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none रिलीज़: 2026-03-03 Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01
स्कोर 7.9 7.9
रैंक #29 #30
संगति 9.6 9.1
सही परीक्षण
प्रति प्रयास पास दर 70.4% 70.6%
अस्थिर टेस्ट 1 2
कुल रन 54 49
प्रति परिणाम लागत 0.130 0.000
कुल लागत $0.016 $0.000
???? ??? $0.250 / 1M $0.100 / 1M
????? ??? $1.500 / 1M $0.300 / 1M
आउटपुट टोकन 5,361 71,904
रीजनिंग टोकन 0 155,607
प्रतिक्रिया समय (औसत) 1.30s 26.78s
प्रतिक्रिया समय (अधिकतम) 3.39s 170.45s
प्रतिक्रिया समय (कुल) 23.42s 294.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 1,092 0
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.47s 640 0
Step 3.5 Flash - - - - - - - -
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 339 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 399 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 568 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 69 0
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 574 0
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 972ms 898 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 782 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

त्वरित तुलना

तुलना जोड़ी बदलें