#201

GPT-5.4 Nano

OpenAI प्रकाशन: 2026-03-17 चाचणी तारीख: 2026-07-16 22:35 openai/gpt-5.4-nano::none

(medium) (none)

सारांश

GPT-5.4 Nano AI BENCHY वर 4.8 स्कोर करते आणि #201 वर आहे. याची reliability 10.0, pass rate 28.8%, एकूण खर्च $0.041, आणि सरासरी response time 2.57s आहे.

GPT-5.4 Nano खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #3 आहे; तर डोमेन-विशिष्ट हा सर्वात कमकुवत भाग आहे, rank #12. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

स्कोअर

4.8

सुसंगतता

8.2

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.041

एकूण आउटपुट टोकन्स

13,794

एकूण इनपुट टोकन्स

115,924

इनपुट किंमत

$0.200 / 1M

आउटपुट किंमत

$1.250 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 18

प्रति प्रयत्न पास दर: 28.8%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

2.57s

प्रतिसाद वेळ (कमाल): 25.50s

प्रतिसाद वेळ (एकूण): 56.51s

चुकीचे उत्तर: 15 सूचनांचे पालन केले नाही: 2 उत्तर नाही: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#201 GPT-5.4 Nano

none

खर्च: $0.008
वेळ: 46.1s
टोकन्स: 5,735 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:35 नवीन चाचणी जोडली	4.8	10.0	$0.041	सध्याची रन
2026-06-04 13:45 नवीन चाचणी जोडली	4.7	10.0	$0.011	तुलना करा
2026-05-22 00:19 सूट बदलला	4.5	10.0	$0.010	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	4.5	लागू नाही	$0.009	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-07-16 22:35 · सध्याची रन	4.8	8.2	10.0	4/22	5	13,794	115,924	$0.041	2.57s
2026-05-22 00:19 · सूट बदलला	4.5	7.6	10.0	3/20	6	2,804	0	$0.010	1.33s
फरक	+0.3	+0.6	0.0	+1	-1	+10990	+115924	+$0.031	+1236ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.200 / 1M	$1.250 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GPT-5.4 NanononevsRing-2.6-1Tnone GPT-5.4 NanononevsTrinity Large Thinkinghigh GPT-5.4 NanononevsLing-2.6-flashnone GPT-5.4 NanononevsKAT-Coder-Air V2.5none GPT-5.4 NanononevsNemotron 3 Supernoneमोफत उपलब्ध GPT-5.4 NanononevsTrinity Large Previewnone GPT-5.4 NanononevsGLM 4.7 Flashnone GPT-5.4 NanononevsQwen3 Coder Nextmedium GPT-5.4 NanononevsGPT-4o-mininone GPT-5.4 NanononevsCobuddymedium

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	3.5	8.0
कोडिंग	4.6	7.9
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	2.9	4.4
Samanya Buddhimatta	3.8	2.5
सूचनांचे पालन	6.3	10.0
कोडी सोडवणे	5.4	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GPT-5.4 Nano

Hamster playing table tennis

#201 GPT-5.4 Nano

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स