नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs StepFun: Step 3.7 Flash

सारांश

Gemini 3.5 Flash vs Step 3.7 Flash benchmark तुलना: Step 3.7 Flash average score मध्ये पुढे आहे: 7.1 vs 7.0. Gemini 3.5 Flash चा benchmark खर्च कमी आहे: $1.079 vs $1.148. Gemini 3.5 Flash वेगवान आहे: 9.93s vs 64.46s, pass rates 77.8% vs 63.5%.

शिफारस केलेले मॉडेल: Gemini 3.5 Flash - Its score stays close to the best score here (7.0 vs 7.1), while responding about 6.5x faster than Step 3.7 Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Gemini 3.5 Flash Gemini 3.5 Flash none प्रकाशन: 2026-05-19 Step 3.7 Flash Step 3.7 Flash high प्रकाशन: 2026-05-29
स्कोअर 7.0 7.1
क्रमांक #66 #63
विश्वसनीयता 10.0 10.0
सुसंगतता 8.9 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 77.8% 63.5%
अस्थिर चाचण्या 3 4
एकूण रन 63 63
प्रति निकाल खर्च 7.190 10.434
एकूण खर्च $1.079 $1.148
इनपुट किंमत $1.500 / 1M $0.200 / 1M
आउटपुट किंमत $9.000 / 1M $1.150 / 1M
एकूण इनपुट टोकन्स 13,843 38,391
आउटपुट टोकन्स 117,518 991,355
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 9.93s 64.46s
प्रतिसाद वेळ (कमाल) 64.36s 364.99s
प्रतिसाद वेळ (एकूण) 178.68s 1353.57s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
Cost
$0.225
Time
125.5s
Tokens
25,004 tok

#63 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

झटपट तुलना

तुलना जोडी बदला