नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite vs StepFun: Step 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-08

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low रिलीज़: 2026-05-08 Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01
स्कोर 7.6 7.6
रैंक #44 #43
विश्वसनीयता 10.0 10.0
संगति 9.2 9.2
सही परीक्षण
प्रति प्रयास पास दर 68.4% 66.7%
अस्थिर टेस्ट 2 2
कुल रन 57 54
प्रति परिणाम लागत 0.203 0.099
कुल लागत $0.025 $0.011
???? ??? $0.250 / 1M $0.100 / 1M
????? ??? $1.500 / 1M $0.300 / 1M
आउटपुट टोकन 2,702 78,299
रीजनिंग टोकन 8,596 173,409
प्रतिक्रिया समय (औसत) 1.92s 41.66s
प्रतिक्रिया समय (अधिकतम) 5.66s 170.45s
प्रतिक्रिया समय (कुल) 36.49s 499.91s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 7.3 6.2 75.0% 2 1.84s 1,013 1,548
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 20,391 24,176
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.46s 441 408
Step 3.5 Flash - - - - - - - -
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 4.48s 348 975
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.44s 291 697
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 5.3 10.0 33.3% 0 1.52s 15 1,214
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 1.37s 69 438
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 240 3,506
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.52s 72 760
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.40s 210 1,191
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 5.66s 234 945
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 1.46s 9 420
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 2,354 10,372

त्वरित तुलना

तुलना जोड़ी बदलें