नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: GPT-5.4 Nano

सारांश

Claude Opus 4.6 vs GPT-5.4 Nano benchmark तुलना: Claude Opus 4.6 average score मध्ये पुढे आहे: 7.7 vs 7.5. GPT-5.4 Nano चा benchmark खर्च कमी आहे: $0.107 vs $2.053. GPT-5.4 Nano वेगवान आहे: 11.95s vs 25.89s, pass rates 61.9% vs 63.5%.

शिफारस केलेले मॉडेल: GPT-5.4 Nano - Its score stays close to the best score here (7.5 vs 7.7), while costing about 19.3x less than Claude Opus 4.6.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05 GPT-5.4 Nano GPT-5.4 Nano medium प्रकाशन: 2026-03-17
स्कोअर 7.7 7.5
क्रमांक #41 #48
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 8.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 61.9% 63.5%
अस्थिर चाचण्या 3 4
एकूण रन 63 63
प्रति निकाल खर्च 17.103 0.969
एकूण खर्च $2.053 $0.107
इनपुट किंमत $5.000 / 1M $0.200 / 1M
आउटपुट किंमत $25.000 / 1M $1.250 / 1M
एकूण इनपुट टोकन्स 53,227 35,434
आउटपुट टोकन्स 47,446 3,014
रिझनिंग टोकन्स 24,000 76,520
प्रतिसाद वेळ (सरासरी) 25.89s 11.95s
प्रतिसाद वेळ (कमाल) 83.40s 94.06s
प्रतिसाद वेळ (एकूण) 362.49s 250.98s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#41 Claude Opus 4.6

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#48 GPT-5.4 Nano

medium
Cost
$0.007
Time
24.6s
Tokens
4,943 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174

झटपट तुलना

तुलना जोडी बदला