नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.5

सारांश

Claude Opus 4.7 vs GPT-5.5 benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.0 vs 7.4. Claude Opus 4.7 चा benchmark खर्च कमी आहे: $0.505 vs $3.679. Claude Opus 4.7 वेगवान आहे: 3.02s vs 37.98s, pass rates 76.2% vs 87.3%.

शिफारस केलेले मॉडेल: Claude Opus 4.7 - It offers the best overall trade-off: a competitive score (7.4), lower cost than GPT-5.5, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none प्रकाशन: 2026-04-16 GPT-5.5 GPT-5.5 medium प्रकाशन: 2026-04-24
स्कोअर 7.4 9.0
क्रमांक #49 #9
विश्वसनीयता 10.0 10.0
सुसंगतता 9.0 8.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 76.2% 87.3%
अस्थिर चाचण्या 0 3
एकूण रन 57 63
प्रति निकाल खर्च 3.154 21.638
एकूण खर्च $0.505 $3.679
इनपुट किंमत $5.000 / 1M $5.000 / 1M
आउटपुट किंमत $25.000 / 1M $30.000 / 1M
एकूण इनपुट टोकन्स 69,576 34,212
आउटपुट टोकन्स 6,265 1,985
रिझनिंग टोकन्स 0 114,925
प्रतिसाद वेळ (सरासरी) 3.02s 37.98s
प्रतिसाद वेळ (कमाल) 18.27s 332.10s
प्रतिसाद वेळ (एकूण) 57.44s 797.60s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#49 Claude Opus 4.7

none
खर्च
$0.051
वेळ
24.2s
टोकन्स
2,181 tok

#9 GPT-5.5

medium
खर्च
$0.112
वेळ
71.9s
टोकन्स
3,807 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 894 522 0
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 3.3 3.3 33.3% 0 2.84s 1,176 494 0
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 37,740 3,504 0
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 10,533 324 0
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 1,020 78 0
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 723 257 0
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 939 114 0
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.46s 939 597 0
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 15,339 372 0
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 3.0 10.0 0.0% 0 1.46s 273 3 0
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754

झटपट तुलना

तुलना जोडी बदला