नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs StepFun: Step 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash low रिलीज़: 2026-05-19 Step 3.5 Flash Step 3.5 Flash none रिलीज़: 2026-02-01
स्कोर 9.3 7.8
रैंक #3 #32
विश्वसनीयता 10.0 10.0
संगति 10.0 10.0
सही परीक्षण
प्रति प्रयास पास दर 90.0% 66.7%
अस्थिर टेस्ट 0 0
कुल रन 60 36
प्रति परिणाम लागत 1.582 0.328
कुल लागत $0.285 $0.020
???? ??? $1.500 / 1M $0.090 / 1M
????? ??? $9.000 / 1M $0.300 / 1M
आउटपुट टोकन 2,027 64,795
रीजनिंग टोकन 23,938 0
प्रतिक्रिया समय (औसत) 2.98s 39.03s
प्रतिक्रिया समय (अधिकतम) 6.44s 114.12s
प्रतिक्रिया समय (कुल) 59.59s 312.26s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 209 2,536
Step 3.5 Flash 10.0 10.0 100.0% 0 34.99s 21,766 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 6.8 10.0 50.0% 0 5.54s 452 6,839
Step 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 351 3,050
Step 3.5 Flash 0.0 0.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 279 1,164
Step 3.5 Flash 0.0 0.0 0.0% 0 0ms 0 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 12 4,538
Step 3.5 Flash 10.0 10.0 100.0% 0 34.54s 7,389 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 119 916
Step 3.5 Flash 4.0 10.0 0.0% 0 14.37s 2,451 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 71 1,652
Step 3.5 Flash 10.0 10.0 100.0% 0 9.30s 1,427 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 288 2,150
Step 3.5 Flash - - - - - - - -
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 234 403
Step 3.5 Flash 0.0 0.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 12 690
Step 3.5 Flash 3.0 10.0 0.0% 0 114.12s 31,762 0

त्वरित तुलना

तुलना जोड़ी बदलें