नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.5

सारांश

Claude Opus 4.8 vs GPT-5.5 benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.0 vs 7.2. Claude Opus 4.8 चा benchmark खर्च कमी आहे: $0.539 vs $3.679. Claude Opus 4.8 वेगवान आहे: 3.47s vs 37.98s, pass rates 61.9% vs 87.3%.

शिफारस केलेले मॉडेल: Claude Opus 4.8 - It offers the best overall trade-off: a competitive score (7.2), lower cost than GPT-5.5, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28 GPT-5.5 GPT-5.5 medium प्रकाशन: 2026-04-24
स्कोअर 7.2 9.0
क्रमांक #57 #9
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 8.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 61.9% 87.3%
अस्थिर चाचण्या 2 3
एकूण रन 63 63
प्रति निकाल खर्च 4.485 21.638
एकूण खर्च $0.539 $3.679
इनपुट किंमत $5.000 / 1M $5.000 / 1M
आउटपुट किंमत $25.000 / 1M $30.000 / 1M
एकूण इनपुट टोकन्स 67,104 34,212
आउटपुट टोकन्स 8,107 1,985
रिझनिंग टोकन्स 0 114,925
प्रतिसाद वेळ (सरासरी) 3.47s 37.98s
प्रतिसाद वेळ (कमाल) 17.73s 332.10s
प्रतिसाद वेळ (एकूण) 72.90s 797.60s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 Claude Opus 4.8

none
खर्च
$0.053
वेळ
22.0s
टोकन्स
2,253 tok

#9 GPT-5.5

medium
खर्च
$0.112
वेळ
71.9s
टोकन्स
3,807 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 834 1,472 0
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.5 10.0 33.3% 0 3.29s 10,590 1,332 0
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 29,658 3,259 0
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 10,503 308 0
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 975 61 0
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 708 230 0
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 909 95 0
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 894 783 0
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 11,775 355 0
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 258 212 0
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754

झटपट तुलना

तुलना जोडी बदला