नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.5

सारांश

Claude Sonnet 4.6 vs GPT-5.5 benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.0 vs 7.3. Claude Sonnet 4.6 चा benchmark खर्च कमी आहे: $0.316 vs $3.679. Claude Sonnet 4.6 वेगवान आहे: 5.04s vs 37.98s, pass rates 55.6% vs 87.3%.

शिफारस केलेले मॉडेल: GPT-5.5 - It has the strongest score in this comparison (9.0) and the best overall balance of cost and response time across all 2 models.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 GPT-5.5 GPT-5.5 medium प्रकाशन: 2026-04-24
स्कोअर 7.3 9.0
क्रमांक #55 #9
विश्वसनीयता 10.0 10.0
सुसंगतता 9.7 8.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 55.6% 87.3%
अस्थिर चाचण्या 1 3
एकूण रन 63 63
प्रति निकाल खर्च 2.870 21.638
एकूण खर्च $0.316 $3.679
इनपुट किंमत $3.000 / 1M $5.000 / 1M
आउटपुट किंमत $15.000 / 1M $30.000 / 1M
एकूण इनपुट टोकन्स 57,886 34,212
आउटपुट टोकन्स 9,465 1,985
रिझनिंग टोकन्स 0 114,925
प्रतिसाद वेळ (सरासरी) 5.04s 37.98s
प्रतिसाद वेळ (कमाल) 23.84s 332.10s
प्रतिसाद वेळ (एकूण) 70.60s 797.60s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#55 Claude Sonnet 4.6

none
खर्च
$0.038
वेळ
27.3s
टोकन्स
2,598 tok

#9 GPT-5.5

medium
खर्च
$0.112
वेळ
71.9s
टोकन्स
3,807 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754

झटपट तुलना

तुलना जोडी बदला