नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5 Nano vs StepFun: Step 3.7 Flash

सारांश

GPT-5 Nano vs Step 3.7 Flash benchmark तुलना: Step 3.7 Flash average score मध्ये पुढे आहे: 7.1 vs 6.7. GPT-5 Nano चा benchmark खर्च कमी आहे: $0.081 vs $1.148. GPT-5 Nano वेगवान आहे: 42.51s vs 64.46s, pass rates 57.1% vs 63.5%.

शिफारस केलेले मॉडेल: GPT-5 Nano - Its score stays close to the best score here (6.7 vs 7.1), while costing about 14.2x less than Step 3.7 Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5 Nano GPT-5 Nano medium प्रकाशन: 2025-08-07 Step 3.7 Flash Step 3.7 Flash high प्रकाशन: 2026-05-29
स्कोअर 6.7 7.1
क्रमांक #79 #63
विश्वसनीयता 10.0 10.0
सुसंगतता 7.3 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 57.1% 63.5%
अस्थिर चाचण्या 7 4
एकूण रन 63 63
प्रति निकाल खर्च 0.897 10.434
एकूण खर्च $0.081 $1.148
इनपुट किंमत $0.050 / 1M $0.200 / 1M
आउटपुट किंमत $0.400 / 1M $1.150 / 1M
एकूण इनपुट टोकन्स 34,108 38,391
आउटपुट टोकन्स 5,464 991,355
रिझनिंग टोकन्स 192,064 0
प्रतिसाद वेळ (सरासरी) 42.51s 64.46s
प्रतिसाद वेळ (कमाल) 204.02s 364.99s
प्रतिसाद वेळ (एकूण) 595.09s 1353.57s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#79 GPT-5 Nano

medium
खर्च
$0.006
वेळ
108.5s
टोकन्स
13,209 tok

#63 Step 3.7 Flash

high
खर्च
$0.007
वेळ
63.6s
टोकन्स
6,030 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 606 1,221 21,184
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 7.0 7.7 55.6% 1 41.62s 7,305 740 41,152
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 11,019 578 17,984
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 7,140 453 10,560
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 619 237 64,448
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 477 202 4,608
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 9.8 10.0 100.0% 0 15.64s 660 312 4,736
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 5.3 7.2 44.4% 1 20.63s 642 929 14,272
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 5,445 558 6,976
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5 Nano 3.0 10.0 0.0% 0 20.13s 195 234 6,144
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

झटपट तुलना

तुलना जोडी बदला