नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.3-Codex

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-14

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 GPT-5.3-Codex GPT-5.3-Codex medium प्रकाशन: 2026-02-05
स्कोअर 7.4 8.6
क्रमांक #39 #5
सुसंगतता 9.6 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 64.8% 83.3%
अस्थिर चाचण्या 1 3
एकूण रन 54 54
प्रति निकाल खर्च 2.376 4.405
एकूण खर्च $0.262 $0.573
???? ??? $3.000 / 1M $1.750 / 1M
????? ??? $15.000 / 1M $14.000 / 1M
आउटपुट टोकन्स 7,433 2,279
रिझनिंग टोकन्स 0 35,179
प्रतिसाद वेळ (सरासरी) 4.98s 15.38s
प्रतिसाद वेळ (कमाल) 23.84s 100.93s
प्रतिसाद वेळ (एकूण) 54.83s 276.91s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 8.95s 491 1,530
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492

झटपट तुलना

तुलना जोडी बदला