नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs OpenAI: GPT-5.3-Codex

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-15

मेट्रिक GPT-5.2 Chat GPT-5.2 Chat none प्रकाशन: 2025-12-11 GPT-5.3-Codex GPT-5.3-Codex medium प्रकाशन: 2026-02-05
क्रमांक #17 #5
स्कोअर 8.0 8.7
सुसंगतता 9.1 9.1
प्रति निकाल खर्च 2.440 4.485
एकूण खर्च $0.269 $0.539
बरोबर चाचण्या
प्रति प्रयत्न पास दर 75.0% 83.3%
अस्थिर चाचण्या 2 2
एकूण रन 48 48
आउटपुट टोकन्स 15,845 1,764
रिझनिंग टोकन्स 0 33,348
प्रतिसाद वेळ (सरासरी) 7.03s 16.59s
प्रतिसाद वेळ (कमाल) 38.52s 100.93s
प्रतिसाद वेळ (एकूण) 112.51s 265.39s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.97s 1,651 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 4.69s 216 1,421
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 7.5 6.1 83.3% 1 5.46s 1,528 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492

झटपट तुलना

तुलना जोडी बदला