AI BENCHY
Advertise here

#121

GPT-5.4

OpenAI प्रकाशन: 2026-03-05 चाचणी तारीख: 2026-05-22 00:18 openai/gpt-5.4::none
(medium) (none)

सुसंगतता

9.1

एकूण आउटपुट टोकन्स

2,402

एकूण इनपुट टोकन्स

31,593

इनपुट किंमत

$2.500 / 1M

आउटपुट किंमत

$15.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 13

प्रति प्रयत्न पास दर: 38.3%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.45s

प्रतिसाद वेळ (कमाल): 2.95s

प्रतिसाद वेळ (एकूण): 29.00s

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-05-22 00:18 सूट बदलला 5.6 10.0 $0.115 सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन 5.9 लागू नाही $0.104 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-05-22 00:18 · सध्याची रन5.69.110.07/2022,40231,593$0.1161.45s
2026-04-11 01:44 · पहिली नोंदलेली रन5.99.1लागू नाही7/1822,3170$0.1041.51s
फरक-0.30.000+85+31593+$0.012-62ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-03 21:35 $2.500 / 1M $15.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.2 8.0
कोडिंग 6.8 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 7.2
Samanya Buddhimatta 4.4 9.9
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 5.6 9.8
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स