नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4 Nano

सारांश

Claude Sonnet 4.6 vs GPT-5.4 Nano benchmark तुलना: GPT-5.4 Nano average score मध्ये पुढे आहे: 7.5 vs 7.3. GPT-5.4 Nano चा benchmark खर्च कमी आहे: $0.107 vs $0.316. Claude Sonnet 4.6 वेगवान आहे: 5.04s vs 11.95s, pass rates 55.6% vs 63.5%.

शिफारस केलेले मॉडेल: GPT-5.4 Nano - It has the best score here (7.5), while costing about 3.0x less than Claude Sonnet 4.6.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 GPT-5.4 Nano GPT-5.4 Nano medium प्रकाशन: 2026-03-17
स्कोअर 7.3 7.5
क्रमांक #56 #48
विश्वसनीयता 10.0 10.0
सुसंगतता 9.7 8.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 55.6% 63.5%
अस्थिर चाचण्या 1 4
एकूण रन 63 63
प्रति निकाल खर्च 2.870 0.969
एकूण खर्च $0.316 $0.107
इनपुट किंमत $3.000 / 1M $0.200 / 1M
आउटपुट किंमत $15.000 / 1M $1.250 / 1M
एकूण इनपुट टोकन्स 57,886 35,434
आउटपुट टोकन्स 9,465 3,014
रिझनिंग टोकन्स 0 76,520
प्रतिसाद वेळ (सरासरी) 5.04s 11.95s
प्रतिसाद वेळ (कमाल) 23.84s 94.06s
प्रतिसाद वेळ (एकूण) 70.60s 250.98s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#48 GPT-5.4 Nano

medium
Cost
$0.007
Time
24.6s
Tokens
4,943 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174

झटपट तुलना

तुलना जोडी बदला