नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.7 Flash vs xAI: Grok 4.3

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Step 3.7 Flash Step 3.7 Flash low प्रकाशन: 2026-05-29 Grok 4.3 Grok 4.3 medium प्रकाशन: 2026-05-01
स्कोअर 7.4 7.8
क्रमांक #60 #36
विश्वसनीयता 10.0 10.0
सुसंगतता 8.7 8.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.3% 75.0%
अस्थिर चाचण्या 3 4
एकूण रन 60 60
प्रति निकाल खर्च 2.796 4.557
एकूण खर्च $0.336 $0.593
इनपुट किंमत $0.200 / 1M $1.250 / 1M
आउटपुट किंमत $1.150 / 1M $2.500 / 1M
आउटपुट टोकन्स 285,209 1,485
रिझनिंग टोकन्स 0 214,710
प्रतिसाद वेळ (सरासरी) 16.06s 49.23s
प्रतिसाद वेळ (कमाल) 124.75s 216.69s
प्रतिसाद वेळ (एकूण) 321.11s 984.52s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
Grok 4.3 7.4 6.5 66.7% 1 55.26s 532 24,554
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
Grok 4.3 5.9 7.2 55.6% 1 22.52s 128 14,468
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 14 12,986

झटपट तुलना

तुलना जोडी बदला