नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.3-Codex

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 GPT-5.3-Codex GPT-5.3-Codex medium प्रकाशन: 2026-02-05
स्कोअर 7.0 8.3
क्रमांक #78 #17
विश्वसनीयता 10.0 10.0
सुसंगतता 9.7 8.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 58.3% 81.7%
अस्थिर चाचण्या 1 4
एकूण रन 60 60
प्रति निकाल खर्च 2.782 4.887
एकूण खर्च $0.306 $0.685
इनपुट किंमत $3.000 / 1M $1.750 / 1M
आउटपुट किंमत $15.000 / 1M $14.000 / 1M
आउटपुट टोकन्स 9,450 2,336
रिझनिंग टोकन्स 0 42,565
प्रतिसाद वेळ (सरासरी) 5.27s 15.95s
प्रतिसाद वेळ (कमाल) 23.84s 100.93s
प्रतिसाद वेळ (एकूण) 68.50s 319.08s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.8 10.0 50.0% 0 6.73s 2,112 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 18.45s 514 7,266
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 533 0
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.05s 356 1,593
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 431 0
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701

झटपट तुलना

तुलना जोडी बदला