नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक Anthropic: Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 OpenAI: GPT-5.4 medium प्रकाशन: 2026-03-05
क्रमांक #25 #9
सरासरी स्कोअर 6.8 8.0
सुसंगतता 9.6 8.5
प्रति निकाल खर्च 2.504 6.601
एकूण खर्च $0.251 $0.793
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 83.3%
अस्थिर चाचण्या 1 3
एकूण रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन्स 6,895 1,756
रिझनिंग टोकन्स 0 46,642
प्रतिसाद वेळ (सरासरी) 5.57s 20.05s
प्रतिसाद वेळ (कमाल) 23.84s 100.41s
प्रतिसाद वेळ (एकूण) 50.12s 320.87s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Sonnet 4.6 4.0 10.0 33.3% 0 4.83s 1,199 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Sonnet 4.6 9.0 10.0 100.0% 0 23.84s 3,766 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Sonnet 4.6 9.9 10.0 100.0% 0 3.43s 252 0
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Sonnet 4.6 7.0 10.0 66.7% 0 3.54s 413 0
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Sonnet 4.6 5.0 3.1 66.7% 1 2.56s 192 0
OpenAI: GPT-5.4 5.0 3.1 33.3% 1 4.92s 145 321
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Sonnet 4.6 5.5 10.0 50.0% 0 1.96s 90 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Sonnet 4.6 7.0 10.0 66.7% 0 2.92s 536 0
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

झटपट तुलना

तुलना जोडी बदला