#29

GPT-5.2 Chat

OpenAI प्रकाशन: 2025-12-11 चाचणी तारीख: 2026-07-16 22:40 openai/gpt-5.2-chat::none

सारांश

GPT-5.2 Chat AI BENCHY वर 8.0 स्कोर करते आणि #29 वर आहे. याची reliability 10.0, pass rate 74.2%, एकूण खर्च $0.604, आणि सरासरी response time 7.65s आहे.

GPT-5.2 Chat खास का आहे: समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

स्कोअर

8.0

सुसंगतता

8.6

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.604

एकूण आउटपुट टोकन्स

30,424

एकूण इनपुट टोकन्स

101,248

इनपुट किंमत

$1.750 / 1M

आउटपुट किंमत

$14.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 8

प्रति प्रयत्न पास दर: 74.2%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

7.65s

प्रतिसाद वेळ (कमाल): 38.52s

प्रतिसाद वेळ (एकूण): 168.39s

चुकीचे उत्तर: 6 सूचनांचे पालन केले नाही: 1 उत्तर नाही: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#29 GPT-5.2 Chat

none

खर्च: $0.010
वेळ: 15.3s
टोकन्स: 797 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:40 नवीन चाचणी जोडली	8.0	10.0	$0.604	सध्याची रन
2026-06-04 13:47 नवीन चाचणी जोडली	7.9	10.0	$0.393	तुलना करा
2026-05-22 00:19 सूट बदलला	7.6	10.0	$0.355	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	7.9	लागू नाही	$0.291	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-07-16 22:40 · सध्याची रन	8.0	8.6	10.0	14/22	4	30,424	101,248	$0.604	7.65s
2026-04-11 01:44 · पहिली नोंदलेली रन	7.9	8.7	लागू नाही	12/18	3	17,346	0	$0.291	6.84s
फरक	+0.1	-0.1		+2	+1	+13078	+101248	+$0.313	+811ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$1.750 / 1M	$14.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

GPT-5.2 ChatnonevsStep 3.7 Flashmedium GPT-5.2 ChatnonevsGLM 5.2high GPT-5.2 ChatnonevsMuse Spark 1.1high GPT-5.2 ChatnonevsKimi K3max GPT-5.2 ChatnonevsGPT-5 Minimedium GPT-5.2 ChatnonevsGPT-5.6 Terrahigh GPT-5.2 ChatnonevsGemini 3 Flash Previewmedium GPT-5.2 ChatnonevsGemini 3.5 Flashhigh GPT-5.2 ChatnonevsNemotron 3 Ultramediumमोफत उपलब्ध GPT-5.2 ChatnonevsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	8.7	7.9
कोडिंग	8.8	7.8
संयुक्त	7.3	5.8
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	4.4	3.0
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GPT-5.2 Chat

Hamster playing table tennis

#29 GPT-5.2 Chat

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स