नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.5 Flash vs StepFun: Step 3.7 Flash

सारांश

Gemini 3.5 Flash vs Step 3.7 Flash benchmark तुलना: Gemini 3.5 Flash average score में आगे है: 9.1 vs 7.1. Gemini 3.5 Flash की benchmark लागत कम है: $0.582 vs $1.148. Gemini 3.5 Flash तेज है: 4.94s vs 64.46s, pass rates 87.3% vs 63.5%.

अनुशंसित मॉडल: Gemini 3.5 Flash - It has the best score here (9.1), while costing about 2.0x less than Step 3.7 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash medium रिलीज़: 2026-05-19 Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29
स्कोर 9.1 7.1
रैंक #8 #63
विश्वसनीयता 10.0 10.0
संगति 9.6 8.2
सही परीक्षण
प्रति प्रयास पास दर 87.3% 63.5%
अस्थिर टेस्ट 1 4
कुल रन 63 63
प्रति परिणाम लागत 3.229 10.434
कुल लागत $0.582 $1.148
इनपुट कीमत $1.500 / 1M $0.200 / 1M
आउटपुट कीमत $9.000 / 1M $1.150 / 1M
कुल इनपुट टोकन 36,936 38,391
आउटपुट टोकन 2,001 991,355
रीजनिंग टोकन 56,408 0
प्रतिक्रिया समय (औसत) 4.94s 64.46s
प्रतिक्रिया समय (अधिकतम) 18.07s 364.99s
प्रतिक्रिया समय (कुल) 103.79s 1353.57s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#8 Gemini 3.5 Flash

medium
लागत
$0.201
समय
112.9s
टोकन
22,371 tok

#63 Step 3.7 Flash

high
लागत
$0.007
समय
63.6s
टोकन
6,030 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.09s 492 171 3,385
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.9 7.5 77.8% 1 12.63s 8,118 461 24,939
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 12.05s 12,873 351 7,807
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 4.07s 7,548 279 3,784
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.7 10.0 66.7% 0 5.24s 633 12 8,047
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 486 115 1,144
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 9.9 10.0 100.0% 0 2.70s 615 71 2,855
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 7.7 10.0 66.7% 0 2.38s 558 295 2,747
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.81s 5,457 234 455
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.75s 156 12 1,245
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

त्वरित तुलना

तुलना जोड़ी बदलें