नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.4 Nano

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28 GPT-5.4 Nano GPT-5.4 Nano medium प्रकाशन: 2026-03-17
स्कोअर 7.3 7.2
क्रमांक #63 #69
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.0% 63.3%
अस्थिर चाचण्या 2 3
एकूण रन 60 60
प्रति निकाल खर्च 4.324 0.900
एकूण खर्च $0.519 $0.099
इनपुट किंमत $5.000 / 1M $0.200 / 1M
आउटपुट किंमत $25.000 / 1M $1.250 / 1M
आउटपुट टोकन्स 8,098 2,993
रिझनिंग टोकन्स 0 70,928
प्रतिसाद वेळ (सरासरी) 3.51s 11.79s
प्रतिसाद वेळ (कमाल) 17.73s 94.06s
प्रतिसाद वेळ (एकूण) 70.19s 235.81s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
GPT-5.4 Nano 6.8 6.2 66.7% 1 21.10s 495 15,186
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 594 1,408
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 70 1,174

झटपट तुलना

तुलना जोडी बदला