#94

GPT-5 Nano

OpenAI प्रकाशन: 2025-08-07 चाचणी तारीख: 2026-05-22 00:17 openai/gpt-5-nano::medium

सारांश

GPT-5 Nano AI BENCHY वर 6.1 स्कोर करते आणि #94 वर आहे. याची reliability 10.0, pass rate 55.0%, एकूण खर्च $0.076, आणि सरासरी response time 43.11s आहे.

GPT-5 Nano खास का आहे: हे संयुक्त मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #14. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

स्कोअर

6.1

सुसंगतता

7.1

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.076

एकूण आउटपुट टोकन्स

184,922

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.050 / 1M

आउटपुट किंमत

$0.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 55.0%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

43.11s

प्रतिसाद वेळ (कमाल): 204.02s

प्रतिसाद वेळ (एकूण): 560.45s

चुकीचे उत्तर: 9 सूचनांचे पालन केले नाही: 2 वेळ संपला: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#94 GPT-5 Nano

medium

खर्च: $0.006
वेळ: 108.5s
टोकन्स: 13,209 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:44 नवीन चाचणी जोडली	6.3	10.0	$0.081	तुलना करा
2026-05-22 00:17 सूट बदलला	6.1	10.0	$0.076	सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन	6.3	लागू नाही	$0.066	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GPT-5 NanomediumvsGemini 3.5 Flashminimal GPT-5 NanomediumvsQwen3.7 Maxnone GPT-5 NanomediumvsRing-2.6-1Tmedium GPT-5 NanomediumvsGemini 3 Flash Previewnone GPT-5 NanomediumvsGemini 3.5 Flashhigh GPT-5 NanomediumvsGemini 3 Flash Previewmedium GPT-5 NanomediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध GPT-5 NanomediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	6.5	7.9
कोडिंग	5.4	6.6
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	3.7	1.7
डोमेन-विशिष्ट	5.2	4.4
Samanya Buddhimatta	4.1	10.0
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	5.3	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GPT-5 Nano

Hamster playing table tennis

#94 GPT-5 Nano

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स