नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs OpenAI: GPT-5.4 Nano

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 GPT-5.4 Nano GPT-5.4 Nano medium रिलीज़: 2026-03-17
रैंक #26 #28
स्कोर 7.6 7.4
संगति 8.6 9.0
प्रति परिणाम लागत 3.177 0.769
कुल लागत $0.318 $0.077
सही परीक्षण
प्रति प्रयास पास दर 66.7% 66.7%
अस्थिर टेस्ट 3 2
कुल रन 51 51
आउटपुट टोकन 19,348 2,474
रीजनिंग टोकन 0 54,516
प्रतिक्रिया समय (औसत) 5.68s 11.08s
प्रतिक्रिया समय (अधिकतम) 18.33s 94.06s
प्रतिक्रिया समय (कुल) 96.58s 188.39s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

त्वरित तुलना

तुलना जोड़ी बदलें