नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs StepFun: Step 3.7 Flash

सारांश

Gemini 3.5 Flash vs Step 3.7 Flash benchmark तुलना: Step 3.7 Flash average score में आगे है: 8.5 vs 7.0. Step 3.7 Flash की benchmark लागत कम है: $0.376 vs $1.079. Gemini 3.5 Flash तेज है: 9.93s vs 20.35s, pass rates 77.8% vs 73.0%.

अनुशंसित मॉडल: Step 3.7 Flash - It has the best score here (8.5), while costing about 2.9x less than Gemini 3.5 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash none रिलीज़: 2026-05-19 Step 3.7 Flash Step 3.7 Flash medium रिलीज़: 2026-05-29
स्कोर 7.0 8.5
रैंक #66 #23
विश्वसनीयता 10.0 9.9
संगति 8.9 9.3
सही परीक्षण
प्रति प्रयास पास दर 77.8% 73.0%
अस्थिर टेस्ट 3 2
कुल रन 63 61
प्रति परिणाम लागत 7.190 2.686
कुल लागत $1.079 $0.376
इनपुट कीमत $1.500 / 1M $0.200 / 1M
आउटपुट कीमत $9.000 / 1M $1.150 / 1M
कुल इनपुट टोकन 13,843 39,981
आउटपुट टोकन 117,518 319,958
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 9.93s 20.35s
प्रतिक्रिया समय (अधिकतम) 64.36s 113.98s
प्रतिक्रिया समय (कुल) 178.68s 427.42s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
Cost
$0.225
Time
125.5s
Tokens
25,004 tok

#23 Step 3.7 Flash

medium
Cost
$0.006
Time
46.2s
Tokens
4,466 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 756 32,185 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
Step 3.7 Flash 8.8 7.8 88.9% 1 27.42s 7,437 44,797 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 13,683 7,106 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 7,398 3,020 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 708 70,347 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 525 3,987 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 735 2,166 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 756 15,071 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 7,746 2,115 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 237 139,164 0

त्वरित तुलना

तुलना जोड़ी बदलें