#64

GPT-5.4 Nano

OpenAI प्रकाशन: 2026-03-17 चाचणी तारीख: 2026-05-22 00:20 openai/gpt-5.4-nano::medium

(medium) (none)

सारांश

GPT-5.4 Nano AI BENCHY वर 7.1 स्कोर करते आणि #64 वर आहे. याची reliability 10.0, pass rate 63.3%, एकूण खर्च $0.099, आणि सरासरी response time 11.77s आहे.

GPT-5.4 Nano खास का आहे: हे डोमेन-विशिष्ट मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #3 आहे; तर कोडी सोडवणे हा सर्वात कमकुवत भाग आहे, rank #17. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

स्कोअर

7.1

सुसंगतता

8.8

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.099

एकूण आउटपुट टोकन्स

73,915

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.200 / 1M

आउटपुट किंमत

$1.250 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 9

प्रति प्रयत्न पास दर: 63.3%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

11.77s

प्रतिसाद वेळ (कमाल): 94.06s

प्रतिसाद वेळ (एकूण): 235.41s

चुकीचे उत्तर: 7 सूचनांचे पालन केले नाही: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#64 GPT-5.4 Nano

medium

खर्च: $0.007
वेळ: 24.6s
टोकन्स: 4,943 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:36 नवीन चाचणी जोडली	7.5	10.0	$0.138	तुलना करा
2026-06-04 13:46 नवीन चाचणी जोडली	7.0	10.0	$0.107	तुलना करा
2026-05-22 00:20 सूट बदलला	7.1	10.0	$0.099	सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन	7.6	लागू नाही	$0.083	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GPT-5.4 NanomediumvsKimi K2.7 Codemedium GPT-5.4 NanomediumvsGPT-5.3 Chatnone GPT-5.4 NanomediumvsClaude Opus 5none GPT-5.4 NanomediumvsGPT-5.6 Terralow GPT-5.4 NanomediumvsNemotron 3 Ultramediumमोफत उपलब्ध GPT-5.4 NanomediumvsGPT-5.4 Minimedium GPT-5.4 NanomediumvsGPT-5.6 Lunamedium GPT-5.4 NanomediumvsQwen3.5 Plus 2026-02-15medium GPT-5.4 NanomediumvsGrok Build 0.1medium GPT-5.4 NanomediumvsQwen3.5-27Bmedium

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	8.3	10.0
कोडिंग	6.8	6.2
संयुक्त	9.8	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.9	7.2
Samanya Buddhimatta	4.5	10.0
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	3.7	7.1
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GPT-5.4 Nano

Hamster playing table tennis

#64 GPT-5.4 Nano

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स