नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs StepFun: Step 3.5 Flash

सारांश

GPT-5.5 vs Step 3.5 Flash benchmark तुलना: Step 3.5 Flash average score मध्ये पुढे आहे: 6.6 vs 6.3. Step 3.5 Flash चा benchmark खर्च कमी आहे: $0.070 vs $0.231. GPT-5.5 वेगवान आहे: 1.89s vs 72.53s, pass rates 54.0% vs 54.0%.

शिफारस केलेले मॉडेल: Step 3.5 Flash - It has the best score here (6.6), while costing about 3.3x less than GPT-5.5.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5.5 GPT-5.5 none प्रकाशन: 2026-04-24 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01
स्कोअर 6.3 6.6
क्रमांक #90 #80
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 8.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 54.0% 54.0%
अस्थिर चाचण्या 3 1
एकूण रन 63 60
प्रति निकाल खर्च 2.302 0.198
एकूण खर्च $0.231 $0.070
इनपुट किंमत $5.000 / 1M $0.090 / 1M
आउटपुट किंमत $30.000 / 1M $0.300 / 1M
एकूण इनपुट टोकन्स 34,212 34,431
आउटपुट टोकन्स 1,971 91,587
रिझनिंग टोकन्स 0 195,973
प्रतिसाद वेळ (सरासरी) 1.89s 72.53s
प्रतिसाद वेळ (कमाल) 5.56s 453.94s
प्रतिसाद वेळ (एकूण) 39.64s 1015.47s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#90 GPT-5.5

none
खर्च
$0.090
वेळ
54.3s
टोकन्स
3,063 tok

#80 Step 3.5 Flash

medium
खर्च
$0.008
वेळ
277.1s
टोकन्स
23,695 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 694 20,391 24,176
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
Step 3.5 Flash 2.4 5.2 0.0% 0 258.38s 2,211 13,207 22,429
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 13,638 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 7,368 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 673 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 509 240 3,506
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 705 2,364 3,521
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 711 5,630 10,861
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 7,701 275 3,802
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 221 2,354 10,372

झटपट तुलना

तुलना जोडी बदला