नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 31B vs StepFun: Step 3.7 Flash

सारांश

Gemma 4 31B vs Step 3.7 Flash benchmark तुलना: Step 3.7 Flash average score मध्ये पुढे आहे: 7.7 vs 6.3. Gemma 4 31B चा benchmark खर्च कमी आहे: $0.033 vs $0.341. Step 3.7 Flash वेगवान आहे: 15.74s vs 56.55s, pass rates 69.8% vs 68.3%.

शिफारस केलेले मॉडेल: Step 3.7 Flash - It has the best score here (7.7), while responding about 3.6x faster than Gemma 4 31B.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Gemma 4 31B Gemma 4 31B medium प्रकाशन: 2026-04-02 मोफत उपलब्ध Step 3.7 Flash Step 3.7 Flash low प्रकाशन: 2026-05-29
स्कोअर 6.3 7.7
क्रमांक #88 #39
विश्वसनीयता 10.0 10.0
सुसंगतता 9.4 8.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 69.8% 68.3%
अस्थिर चाचण्या 1 4
एकूण रन 63 63
प्रति निकाल खर्च 0.257 2.840
एकूण खर्च $0.033 $0.341
इनपुट किंमत $0.120 / 1M $0.200 / 1M
आउटपुट किंमत $0.350 / 1M $1.150 / 1M
एकूण इनपुट टोकन्स 17,957 40,101
आउटपुट टोकन्स 22,356 289,325
रिझनिंग टोकन्स 65,726 0
प्रतिसाद वेळ (सरासरी) 56.55s 15.74s
प्रतिसाद वेळ (कमाल) 437.40s 124.75s
प्रतिसाद वेळ (एकूण) 1074.41s 330.63s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Gemma 4 31B

medium
खर्च
$0.002
वेळ
45.7s
टोकन्स
2,696 tok

#39 Step 3.7 Flash

low
अवैध SVG
खर्च
$0.004
वेळ
25.3s
टोकन्स
3,072 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

झटपट तुलना

तुलना जोडी बदला