AI BENCHY
Advertise here
#131

GPT-5.4 Mini

OpenAI प्रकाशन: 2026-03-17 चाचणी तारीख: 2026-06-04 13:45 openai/gpt-5.4-mini::none
(medium) (none)

सारांश

GPT-5.4 Mini AI BENCHY वर 5.3 स्कोर करते आणि #131 वर आहे. याची reliability 10.0, pass rate 30.2%, एकूण खर्च $0.038, आणि सरासरी response time 1.13s आहे.

सुसंगतता

8.8

एकूण आउटपुट टोकन्स

2,541

एकूण इनपुट टोकन्स

34,244

इनपुट किंमत

$0.750 / 1M

आउटपुट किंमत

$4.500 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 30.2%

अस्थिर चाचण्या

3

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.13s

प्रतिसाद वेळ (कमाल): 2.52s

प्रतिसाद वेळ (एकूण): 23.82s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:45 नवीन चाचणी जोडली 4.9 10.0 $0.038 सध्याची रन
2026-05-22 00:18 सूट बदलला 4.9 10.0 $0.035 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 5.1 लागू नाही $0.032 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.750 / 1M $4.500 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.1 8.1
कोडिंग 5.5 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.5 4.4
Samanya Buddhimatta 4.8 10.0
सूचनांचे पालन 6.3 10.0
कोडी सोडवणे 5.4 10.0
टूल कॉलिंग 3.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स