AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#149

GPT-5.4 Nano

OpenAI प्रकाशन: 2026-03-17 चाचणी तारीख: 2026-06-04 13:45 openai/gpt-5.4-nano::none
(medium) (none)

सारांश

GPT-5.4 Nano AI BENCHY वर 4.8 स्कोर करते आणि #149 वर आहे. याची reliability 10.0, pass rate 30.2%, एकूण खर्च $0.011, आणि सरासरी response time 1.48s आहे.

GPT-5.4 Nano खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #3 आहे; तर Samanya Buddhimatta हा सर्वात कमकुवत भाग आहे, rank #12. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

सुसंगतता

8.2

एकूण आउटपुट टोकन्स

2,784

एकूण इनपुट टोकन्स

34,212

इनपुट किंमत

$0.200 / 1M

आउटपुट किंमत

$1.250 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 17

प्रति प्रयत्न पास दर: 30.2%

अस्थिर चाचण्या

5

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.48s

प्रतिसाद वेळ (कमाल): 4.47s

प्रतिसाद वेळ (एकूण): 31.01s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#149 GPT-5.4 Nano

none
Cost
$0.008
Time
46.1s
Tokens
5,735 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:45 नवीन चाचणी जोडली 4.7 10.0 $0.011 सध्याची रन
2026-05-22 00:19 सूट बदलला 4.5 10.0 $0.010 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 4.5 लागू नाही $0.009 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:45 · सध्याची रन4.88.210.04/2152,78434,212$0.0111.48s
2026-05-22 00:19 · सूट बदलला4.57.610.03/2062,8040$0.0101.33s
फरक+0.3+0.60.0+1-1-20+34212+$0.001+144ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.200 / 1M $1.250 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.5 8.0
कोडिंग 4.6 7.9
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 6.5 10.0
डोमेन-विशिष्ट 2.9 4.4
Samanya Buddhimatta 3.8 2.5
सूचनांचे पालन 6.3 10.0
कोडी सोडवणे 5.4 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स