नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.5

सारांश

Claude Opus 4.7 vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.0 vs 7.4. Claude Opus 4.7 की benchmark लागत कम है: $0.505 vs $3.679. Claude Opus 4.7 तेज है: 3.02s vs 37.98s, pass rates 76.2% vs 87.3%.

अनुशंसित मॉडल: Claude Opus 4.7 - It offers the best overall trade-off: a competitive score (7.4), lower cost than GPT-5.5, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none रिलीज़: 2026-04-16 GPT-5.5 GPT-5.5 medium रिलीज़: 2026-04-24
स्कोर 7.4 9.0
रैंक #49 #9
विश्वसनीयता 10.0 10.0
संगति 9.0 8.9
सही परीक्षण
प्रति प्रयास पास दर 76.2% 87.3%
अस्थिर टेस्ट 0 3
कुल रन 57 63
प्रति परिणाम लागत 3.154 21.638
कुल लागत $0.505 $3.679
इनपुट कीमत $5.000 / 1M $5.000 / 1M
आउटपुट कीमत $25.000 / 1M $30.000 / 1M
कुल इनपुट टोकन 69,576 34,212
आउटपुट टोकन 6,265 1,985
रीजनिंग टोकन 0 114,925
प्रतिक्रिया समय (औसत) 3.02s 37.98s
प्रतिक्रिया समय (अधिकतम) 18.27s 332.10s
प्रतिक्रिया समय (कुल) 57.44s 797.60s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#49 Claude Opus 4.7

none
लागत
$0.051
समय
24.2s
टोकन
2,181 tok

#9 GPT-5.5

medium
लागत
$0.112
समय
71.9s
टोकन
3,807 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 894 522 0
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.3 3.3 33.3% 0 2.84s 1,176 494 0
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 37,740 3,504 0
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 10,533 324 0
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 1,020 78 0
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 723 257 0
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 939 114 0
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.46s 939 597 0
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 15,339 372 0
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.0 10.0 0.0% 0 1.46s 273 3 0
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754

त्वरित तुलना

तुलना जोड़ी बदलें