नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 2.5 Flash vs StepFun: Step 3.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-01

मेट्रिक Gemini 2.5 Flash Gemini 2.5 Flash medium रिलीज़: 2025-06-17 Step 3.7 Flash Step 3.7 Flash low रिलीज़: 2026-05-29
स्कोर 7.7 7.4
रैंक #40 #59
विश्वसनीयता 10.0 10.0
संगति 9.6 8.7
सही परीक्षण
प्रति प्रयास पास दर 68.3% 68.3%
अस्थिर टेस्ट 1 3
कुल रन 60 60
प्रति परिणाम लागत 2.750 2.796
कुल लागत $0.358 $0.336
इनपुट कीमत $0.300 / 1M $0.200 / 1M
आउटपुट कीमत $2.500 / 1M $1.150 / 1M
आउटपुट टोकन 1,924 285,209
रीजनिंग टोकन 137,255 0
प्रतिक्रिया समय (औसत) 15.57s 16.06s
प्रतिक्रिया समय (अधिकतम) 95.48s 124.75s
प्रतिक्रिया समय (कुल) 311.47s 321.11s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 6.6 10.0 50.0% 0 54.56s 537 24,413
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 126 2,499
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 11 919
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

त्वरित तुलना

तुलना जोड़ी बदलें