#147

GPT-5.4 Nano

OpenAI रिलीज़: 2026-03-17 परीक्षण किया गया: 2026-05-22 00:19 openai/gpt-5.4-nano::none

(medium) (none)

सारांश

GPT-5.4 Nano AI BENCHY पर 4.5 स्कोर करता है और #147 पर है। इसकी reliability 10.0, pass rate 30.0%, कुल लागत $0.010, और औसत response time 1.33s है।

GPT-5.4 Nano को अलग क्या बनाता है: यह समान मॉडलों की तुलना में काफ़ी तेज है।

स्कोर

4.5

संगति

7.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.010

कुल आउटपुट टोकन

2,804

कुल इनपुट टोकन

इनपुट कीमत

$0.200 / 1M

आउटपुट कीमत

$1.250 / 1M

सही परीक्षण

गलत टेस्ट: 17

प्रति प्रयास पास दर: 30.0%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

1.33s

प्रतिक्रिया समय (अधिकतम): 3.84s

प्रतिक्रिया समय (कुल): 26.66s

गलत उत्तर: 15 निर्देशों का पालन नहीं किया: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#147 GPT-5.4 Nano

none

लागत: $0.008
समय: 46.1s
टोकन: 5,735 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:35 नया टेस्ट जोड़ा गया	4.8	10.0	$0.041	तुलना करें
2026-06-04 13:45 नया टेस्ट जोड़ा गया	4.7	10.0	$0.011	तुलना करें
2026-05-22 00:19 सूट बदला गया	4.5	10.0	$0.010	वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन	4.5	लागू नहीं	$0.009	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-05-22 00:19 · सूट बदला गया	4.5	7.6	10.0	3/20	6	2,804	$0.010	1.33s
2026-04-11 01:44 · पहला दर्ज रन	4.5	7.1	लागू नहीं	2/18	7	2,762	$0.009	1.40s
अंतर	0.0	+0.5		+1	-1	+42	+$0.001	-64ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

GPT-5.4 NanononevsRing-2.6-1Tnone GPT-5.4 NanononevsTrinity Large Thinkinghigh GPT-5.4 NanononevsLing-2.6-flashnone GPT-5.4 NanononevsKAT-Coder-Air V2.5none GPT-5.4 NanononevsNemotron 3 Supernoneनिःशुल्क उपलब्ध GPT-5.4 NanononevsTrinity Large Previewnone GPT-5.4 NanononevsGLM 4.7 Flashnone GPT-5.4 NanononevsQwen3 Coder Nextmedium GPT-5.4 NanononevsGPT-4o-mininone GPT-5.4 NanononevsCobuddymedium

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	3.5	8.0
कोडिंग	5.4	6.8
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	2.9	4.4
Samanya Buddhimatta	3.8	2.5
निर्देश पालन	6.3	10.0
पहेली समाधान	3.7	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GPT-5.4 Nano

Hamster playing table tennis

#147 GPT-5.4 Nano

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल