#147

GPT-5.4 Nano

OpenAI प्रकाशन: 2026-03-17 चाचणी तारीख: 2026-05-22 00:19 openai/gpt-5.4-nano::none

(medium) (none)

सारांश

GPT-5.4 Nano AI BENCHY वर 4.5 स्कोर करते आणि #147 वर आहे. याची reliability 10.0, pass rate 30.0%, एकूण खर्च $0.010, आणि सरासरी response time 1.33s आहे.

GPT-5.4 Nano खास का आहे: समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

स्कोअर

4.5

सुसंगतता

7.6

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.010

एकूण आउटपुट टोकन्स

2,804

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.200 / 1M

आउटपुट किंमत

$1.250 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 17

प्रति प्रयत्न पास दर: 30.0%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.33s

प्रतिसाद वेळ (कमाल): 3.84s

प्रतिसाद वेळ (एकूण): 26.66s

चुकीचे उत्तर: 15 सूचनांचे पालन केले नाही: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#147 GPT-5.4 Nano

none

खर्च: $0.008
वेळ: 46.1s
टोकन्स: 5,735 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:35 नवीन चाचणी जोडली	4.8	10.0	$0.041	तुलना करा
2026-06-04 13:45 नवीन चाचणी जोडली	4.7	10.0	$0.011	तुलना करा
2026-05-22 00:19 सूट बदलला	4.5	10.0	$0.010	सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन	4.5	लागू नाही	$0.009	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GPT-5.4 NanononevsRing-2.6-1Tnone GPT-5.4 NanononevsTrinity Large Thinkinghigh GPT-5.4 NanononevsLing-2.6-flashnone GPT-5.4 NanononevsKAT-Coder-Air V2.5none GPT-5.4 NanononevsNemotron 3 Supernoneमोफत उपलब्ध GPT-5.4 NanononevsTrinity Large Previewnone GPT-5.4 NanononevsGLM 4.7 Flashnone GPT-5.4 NanononevsQwen3 Coder Nextmedium GPT-5.4 NanononevsGPT-4o-mininone GPT-5.4 NanononevsCobuddymedium

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	3.5	8.0
कोडिंग	5.4	6.8
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	2.9	4.4
Samanya Buddhimatta	3.8	2.5
सूचनांचे पालन	6.3	10.0
कोडी सोडवणे	3.7	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GPT-5.4 Nano

Hamster playing table tennis

#147 GPT-5.4 Nano

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स