AI BENCHY
तुलना करें
❤️ Made by XCS
Your ad here

मॉडल नाम

OpenAI: GPT-5.3-Codex

तर्क (medium)

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए: : 24 फ़र॰ 2026

मेट्रिक OpenAI: GPT-5.3-Codex
रैंक#6
कंपनीOpenAI
Score 7.77
संगति 8.75
प्रति परिणाम लागत 4.9342
कुल लागत $0.44408
सही परीक्षण
प्रति प्रयास पास दर 76.9%
अस्थिर टेस्ट 2
आउटपुट टोकन 947
रीजनिंग टोकन 29,564
प्रतिक्रिया समय (औसत)17944ms
प्रतिक्रिया समय (कुल)233267ms
प्रतिक्रिया समय (अधिकतम)100927ms

श्रेणी विवरण

श्रेणी पूरी तरह पास टेस्ट Score संगति प्रति प्रयास पास दर अस्थिर टेस्ट तर्क स्कोर प्रतिक्रिया समय (औसत) लागत
एंटी-एआई ट्रिक्स 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
डेटा पार्सिंग और निष्कर्षण 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
डोमेन-विशिष्ट 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
निर्देश पालन 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

तुलना किए गए मॉडल

OpenAI: GPT-5.3-Codex की तुलना इससे करें...

#5 · Google

Google: Gemini 3 Flash Preview

तर्क (low)

Score: 8.23

संगति: 8.71

प्रति प्रयास पास दर: 82.0%

अस्थिर टेस्ट: 2

प्रति परिणाम लागत: 0.6173

सही परीक्षण:

कुल लागत: $0.06174

तुलना करें

#7 · OpenAI

OpenAI: GPT-5.2

तर्क (medium)

Score: 7.38

संगति: 8.73

प्रति प्रयास पास दर: 76.9%

अस्थिर टेस्ट: 2

प्रति परिणाम लागत: 2.5637

सही परीक्षण:

कुल लागत: $0.23074

तुलना करें

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

तर्क (medium)

Score: 8.54

संगति: 9.35

प्रति प्रयास पास दर: 87.2%

अस्थिर टेस्ट: 1

प्रति परिणाम लागत: 2.1621

सही परीक्षण:

कुल लागत: $0.23784

तुलना करें

त्वरित तुलना

OpenAI: GPT-5.3-Codex की तुलना इससे करें...