AI BENCHY
तुलना करा
❤️ Made by XCS
Your ad here

मॉडेल नाव

OpenAI: GPT-5.3-Codex

तर्क (medium)

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले : २४ फेब्रु, २०२६

मेट्रिक OpenAI: GPT-5.3-Codex
क्रमांक#6
कंपनीOpenAI
Score 7.77
सुसंगतता 8.75
प्रति निकाल खर्च 4.9342
एकूण खर्च $0.44408
बरोबर चाचण्या
प्रति प्रयत्न पास दर 76.9%
अस्थिर चाचण्या 2
आउटपुट टोकन्स 947
रिझनिंग टोकन्स 29,564
प्रतिसाद वेळ (सरासरी)17944ms
प्रतिसाद वेळ (एकूण)233267ms
प्रतिसाद वेळ (कमाल)100927ms

श्रेणीवार तपशील

श्रेणी पूर्णपणे पास झालेल्या चाचण्या Score सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या तर्क गुण प्रतिसाद वेळ (सरासरी) खर्च
अँटी-एआय युक्त्या 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
डेटा पार्सिंग आणि निष्कर्षण 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
डोमेन-विशिष्ट 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
सूचनांचे पालन 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

तुलना केलेली मॉडेल्स

OpenAI: GPT-5.3-Codex ची तुलना याच्याशी करा...

#5 · Google

Google: Gemini 3 Flash Preview

तर्क (low)

Score: 8.23

सुसंगतता: 8.71

प्रति प्रयत्न पास दर: 82.0%

अस्थिर चाचण्या: 2

प्रति निकाल खर्च: 0.6173

बरोबर चाचण्या:

एकूण खर्च: $0.06174

तुलना करा

#7 · OpenAI

OpenAI: GPT-5.2

तर्क (medium)

Score: 7.38

सुसंगतता: 8.73

प्रति प्रयत्न पास दर: 76.9%

अस्थिर चाचण्या: 2

प्रति निकाल खर्च: 2.5637

बरोबर चाचण्या:

एकूण खर्च: $0.23074

तुलना करा

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

तर्क (medium)

Score: 8.54

सुसंगतता: 9.35

प्रति प्रयत्न पास दर: 87.2%

अस्थिर चाचण्या: 1

प्रति निकाल खर्च: 2.1621

बरोबर चाचण्या:

एकूण खर्च: $0.23784

तुलना करा

झटपट तुलना

OpenAI: GPT-5.3-Codex ची तुलना याच्याशी करा...