#105

GPT-5.4 Nano

OpenAI रिलीज़: 2026-03-17 परीक्षण किया गया: 2026-04-11 01:44 openai/gpt-5.4-nano::none

(medium) (none)

सारांश

GPT-5.4 Nano AI BENCHY पर 4.5 स्कोर करता है और #105 पर है। इसकी reliability लागू नहीं, pass rate 31.5%, कुल लागत $0.009, और औसत response time 1.40s है।

GPT-5.4 Nano को अलग क्या बनाता है: यह कोडिंग में सबसे अलग दिखता है, जहाँ इसकी रैंक #4 है; जबकि एंटी-एआई ट्रिक्स इसकी सबसे कमजोर जगह है, जहाँ यह #15 पर है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है। यह समान मॉडलों की तुलना में काफ़ी तेज है।

स्कोर

4.5

संगति

7.1

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.009

कुल आउटपुट टोकन

2,762

कुल इनपुट टोकन

इनपुट कीमत

$0.200 / 1M

आउटपुट कीमत

$1.250 / 1M

सही परीक्षण

गलत टेस्ट: 16

प्रति प्रयास पास दर: 31.5%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

1.40s

प्रतिक्रिया समय (अधिकतम): 3.84s

प्रतिक्रिया समय (कुल): 25.14s

गलत उत्तर: 13 निर्देशों का पालन नहीं किया: 3

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#105 GPT-5.4 Nano

none

लागत: $0.008
समय: 46.1s
टोकन: 5,735 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:35 नया टेस्ट जोड़ा गया	4.8	10.0	$0.041	तुलना करें
2026-06-04 13:45 नया टेस्ट जोड़ा गया	4.7	10.0	$0.011	तुलना करें
2026-05-22 00:19 सूट बदला गया	4.5	10.0	$0.010	तुलना करें
2026-04-11 01:44 पहला दर्ज रन	4.5	लागू नहीं	$0.009	वर्तमान रन

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-04-11 01:44 · पहला दर्ज रन	4.5	7.1	लागू नहीं	2/18	7	2,762	0	$0.009	1.40s
2026-06-04 13:45 · नया टेस्ट जोड़ा गया	4.7	8.2	10.0	4/21	5	2,784	34,212	$0.011	1.48s
अंतर	-0.2	-1.1		-2	+2	-22	-34212	-$0.002	-80ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

GPT-5.4 NanononevsRing-2.6-1Tnone GPT-5.4 NanononevsTrinity Large Thinkinghigh GPT-5.4 NanononevsLing-2.6-flashnone GPT-5.4 NanononevsKAT-Coder-Air V2.5none GPT-5.4 NanononevsNemotron 3 Supernoneनिःशुल्क उपलब्ध GPT-5.4 NanononevsTrinity Large Previewnone GPT-5.4 NanononevsGLM 4.7 Flashnone GPT-5.4 NanononevsQwen3 Coder Nextmedium GPT-5.4 NanononevsGPT-4o-mininone GPT-5.4 NanononevsCobuddymedium

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	3.5	8.0
कोडिंग	7.1	3.7
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	2.9	4.4
Samanya Buddhimatta	3.8	2.5
निर्देश पालन	5.0	6.8
पहेली समाधान	3.7	7.3
टूल कॉलिंग	10.0	10.0

GPT-5.4 Nano

Hamster playing table tennis

#105 GPT-5.4 Nano

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल