नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-26

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none प्रकाशन: 2026-04-16 GPT-5.5 GPT-5.5 low प्रकाशन: 2026-04-24
स्कोअर 9.2 9.0
क्रमांक #4 #5
विश्वसनीयता लागू नाही 10.0
सुसंगतता 10.0 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 88.9% 87.0%
अस्थिर चाचण्या 0 1
एकूण रन 54 54
प्रति निकाल खर्च 3.155 4.534
एकूण खर्च $0.505 $0.681
???? ??? $5.000 / 1M $5.000 / 1M
????? ??? $25.000 / 1M $30.000 / 1M
आउटपुट टोकन्स 6,326 1,959
रिझनिंग टोकन्स 0 16,134
प्रतिसाद वेळ (सरासरी) 3.13s 8.39s
प्रतिसाद वेळ (कमाल) 18.27s 56.19s
प्रतिसाद वेळ (एकूण) 56.33s 151.01s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
GPT-5.5 10.0 10.0 100.0% 0 4.15s 232 1,056
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
GPT-5.5 10.0 10.0 100.0% 0 7.79s 369 936
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
GPT-5.5 10.0 10.0 100.0% 0 9.56s 303 717
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 228 157
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
GPT-5.5 5.3 10.0 33.3% 0 27.57s 69 11,731
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
GPT-5.5 10.0 10.0 100.0% 0 3.45s 143 132
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
GPT-5.5 9.9 10.0 100.0% 0 2.98s 93 356
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
GPT-5.5 9.0 7.9 88.9% 1 4.48s 272 948
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
GPT-5.5 10.0 10.0 100.0% 0 4.96s 250 101

झटपट तुलना

तुलना जोडी बदला