नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-26

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium प्रकाशन: 2026-04-16 GPT-5.5 GPT-5.5 low प्रकाशन: 2026-04-24
स्कोअर 9.2 9.0
क्रमांक #3 #5
विश्वसनीयता लागू नाही 10.0
सुसंगतता 10.0 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 88.9% 87.0%
अस्थिर चाचण्या 0 1
एकूण रन 54 54
प्रति निकाल खर्च 2.790 4.534
एकूण खर्च $0.447 $0.681
???? ??? $5.000 / 1M $5.000 / 1M
????? ??? $25.000 / 1M $30.000 / 1M
आउटपुट टोकन्स 5,375 1,959
रिझनिंग टोकन्स 1,341 16,134
प्रतिसाद वेळ (सरासरी) 3.53s 8.39s
प्रतिसाद वेळ (कमाल) 21.45s 56.19s
प्रतिसाद वेळ (एकूण) 60.03s 151.01s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
GPT-5.5 10.0 10.0 100.0% 0 4.15s 232 1,056
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
GPT-5.5 10.0 10.0 100.0% 0 7.79s 369 936
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
GPT-5.5 10.0 10.0 100.0% 0 9.56s 303 717
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 228 157
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
GPT-5.5 5.3 10.0 33.3% 0 27.57s 69 11,731
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
GPT-5.5 10.0 10.0 100.0% 0 3.45s 143 132
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
GPT-5.5 9.9 10.0 100.0% 0 2.98s 93 356
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
GPT-5.5 9.0 7.9 88.9% 1 4.48s 272 948
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
GPT-5.5 10.0 10.0 100.0% 0 4.96s 250 101

झटपट तुलना

तुलना जोडी बदला