#91

GPT-5.5

OpenAI प्रकाशन: 2026-04-24 चाचणी तारीख: 2026-07-16 22:34 openai/gpt-5.5::none

(medium) (low) (none)

सारांश

GPT-5.5 AI BENCHY वर 6.9 स्कोर करते आणि #91 वर आहे. याची reliability 10.0, pass rate 56.1%, एकूण खर्च $0.544, आणि सरासरी response time 2.36s आहे.

स्कोअर

6.9

सुसंगतता

8.9

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.544

एकूण आउटपुट टोकन्स

4,915

एकूण इनपुट टोकन्स

79,285

इनपुट किंमत

$5.000 / 1M

आउटपुट किंमत

$30.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 11

प्रति प्रयत्न पास दर: 56.1%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

2.36s

प्रतिसाद वेळ (कमाल): 12.24s

प्रतिसाद वेळ (एकूण): 51.88s

चुकीचे उत्तर: 11

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 GPT-5.5

none

खर्च: $0.090
वेळ: 54.3s
टोकन्स: 3,063 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:34 नवीन चाचणी जोडली	6.9	10.0	$0.544	सध्याची रन
2026-06-04 13:46 नवीन चाचणी जोडली	6.4	10.0	$0.231	तुलना करा
2026-05-22 00:19 सूट बदलला	6.5	10.0	$0.217	तुलना करा
2026-04-24 19:59 पहिला रन	6.8	लागू नाही	$0.195	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$5.000 / 1M	$30.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GPT-5.5nonevsStep 3.7 Flashhigh GPT-5.5nonevsGemini 3.5 Flashminimal GPT-5.5nonevsQwen3.6 Flashmedium GPT-5.5nonevsGemini 3 Flash Previewnone GPT-5.5nonevsMiMo-V2.5-Promedium GPT-5.5nonevsQwen3.6 35B A3Bmedium GPT-5.5nonevsGPT-5.6 Solnone GPT-5.5nonevsGemini 3.5 Flash-Litelow GPT-5.5nonevsDeepSeek V4 Pronone GPT-5.5nonevsLongCat 2.0low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	6.9	7.9
कोडिंग	5.5	10.0
संयुक्त	6.5	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	6.2	5.8
कोडी सोडवणे	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GPT-5.5

Hamster playing table tennis

#91 GPT-5.5

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स