AI BENCHY
Advertise here
#94

GPT-5 Nano

OpenAI प्रकाशन: 2025-08-07 चाचणी तारीख: 2026-05-22 00:17 openai/gpt-5-nano::medium

सारांश

GPT-5 Nano AI BENCHY वर 6.1 स्कोर करते आणि #94 वर आहे. याची reliability 10.0, pass rate 55.0%, एकूण खर्च $0.076, आणि सरासरी response time 43.11s आहे.

GPT-5 Nano खास का आहे: हे संयुक्त मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #14. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

सुसंगतता

7.1

एकूण आउटपुट टोकन्स

184,922

एकूण इनपुट टोकन्स

0

इनपुट किंमत

$0.050 / 1M

आउटपुट किंमत

$0.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 55.0%

अस्थिर चाचण्या

7

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

43.11s

प्रतिसाद वेळ (कमाल): 204.02s

प्रतिसाद वेळ (एकूण): 560.45s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#94 GPT-5 Nano

medium
खर्च
$0.006
वेळ
108.5s
टोकन्स
13,209 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:44 नवीन चाचणी जोडली 6.3 10.0 $0.081 तुलना करा
2026-05-22 00:17 सूट बदलला 6.1 10.0 $0.076 सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन 6.3 लागू नाही $0.066 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-05-22 00:17 · सूट बदलला6.17.110.08/207184,9220$0.07643.11s
2026-04-11 01:44 · पहिली नोंदलेली रन6.36.5लागू नाही7/188161,2680$0.06644.13s
फरक-0.2+0.6+1-1+236540+$0.010-1022ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 6.5 7.9
कोडिंग 5.4 6.6
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 3.7 1.7
डोमेन-विशिष्ट 5.2 4.4
Samanya Buddhimatta 4.1 10.0
सूचनांचे पालन 9.8 10.0
कोडी सोडवणे 5.3 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स