नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs OpenAI: GPT-5.4

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-16

मेट्रिक GPT-5.3-Codex GPT-5.3-Codex medium प्रकाशन: 2026-02-05 GPT-5.4 GPT-5.4 medium प्रकाशन: 2026-03-05
स्कोअर 8.6 8.2
क्रमांक #7 #16
सुसंगतता 8.7 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 83.3% 79.6%
अस्थिर चाचण्या 3 3
एकूण रन 54 54
प्रति निकाल खर्च 4.405 6.399
एकूण खर्च $0.573 $0.832
???? ??? $1.750 / 1M $2.500 / 1M
????? ??? $14.000 / 1M $15.000 / 1M
आउटपुट टोकन्स 2,279 2,169
रिझनिंग टोकन्स 35,179 48,732
प्रतिसाद वेळ (सरासरी) 15.38s 18.63s
प्रतिसाद वेळ (कमाल) 100.93s 100.41s
प्रतिसाद वेळ (एकूण) 276.91s 335.26s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 8.95s 491 1,530
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

झटपट तुलना

तुलना जोडी बदला