AI BENCHY
Advertise here

#32

GPT-5.2 Chat

OpenAI प्रकाशन: 2025-12-11 चाचणी तारीख: 2026-05-22 00:19 openai/gpt-5.2-chat::none

सुसंगतता

8.9

एकूण आउटपुट टोकन्स

21,144

एकूण इनपुट टोकन्स

31,593

इनपुट किंमत

$1.750 / 1M

आउटपुट किंमत

$14.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 7

प्रति प्रयत्न पास दर: 73.3%

अस्थिर चाचण्या

3

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

6.82s

प्रतिसाद वेळ (कमाल): 38.52s

प्रतिसाद वेळ (एकूण): 136.34s

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-05-22 00:19 सूट बदलला 7.6 10.0 $0.355 सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन 7.9 लागू नाही $0.291 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-05-22 00:19 · सध्याची रन7.98.910.013/20321,14431,593$0.3526.82s
2026-04-11 01:44 · पहिली नोंदलेली रन7.98.7लागू नाही12/18317,3460$0.2916.84s
फरक-0.1+0.2+10+3798+31593+$0.061-26ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-01 11:25 $1.750 / 1M $14.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 8.7 7.9
कोडिंग 8.2 6.7
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 4.4 3.0
सूचनांचे पालन 9.8 10.0
कोडी सोडवणे 7.7 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स