नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-24

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 GPT-5.5 GPT-5.5 medium प्रकाशन: 2026-04-24
स्कोअर 7.4 9.0
क्रमांक #50 #5
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 9.6 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 64.8% 87.0%
अस्थिर चाचण्या 1 2
एकूण रन 54 54
प्रति निकाल खर्च 2.376 19.226
एकूण खर्च $0.262 $2.884
???? ??? $3.000 / 1M $5.000 / 1M
????? ??? $15.000 / 1M $30.000 / 1M
आउटपुट टोकन्स 7,433 1,920
रिझनिंग टोकन्स 0 89,632
प्रतिसाद वेळ (सरासरी) 4.98s 32.75s
प्रतिसाद वेळ (कमाल) 23.84s 332.10s
प्रतिसाद वेळ (एकूण) 54.83s 589.59s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
GPT-5.5 8.6 7.9 77.8% 1 6.78s 250 2,254
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832

झटपट तुलना

तुलना जोडी बदला