नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Anthropic: Claude Sonnet 4.6 none रिलीज़: 2026-02-17 OpenAI: GPT-5.4 medium रिलीज़: 2026-03-05
रैंक #25 #9
औसत स्कोर 6.8 8.0
संगति 9.6 8.5
प्रति परिणाम लागत 2.504 6.601
कुल लागत $0.251 $0.793
सही परीक्षण
प्रति प्रयास पास दर 66.7% 83.3%
अस्थिर टेस्ट 1 3
कुल रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन 6,895 1,756
रीजनिंग टोकन 0 46,642
प्रतिक्रिया समय (औसत) 5.57s 20.05s
प्रतिक्रिया समय (अधिकतम) 23.84s 100.41s
प्रतिक्रिया समय (कुल) 50.12s 320.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6 4.0 10.0 33.3% 0 4.83s 1,199 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6 9.0 10.0 100.0% 0 23.84s 3,766 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6 9.9 10.0 100.0% 0 3.43s 252 0
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6 7.0 10.0 66.7% 0 3.54s 413 0
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6 5.0 3.1 66.7% 1 2.56s 192 0
OpenAI: GPT-5.4 5.0 3.1 33.3% 1 4.92s 145 321
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6 5.5 10.0 50.0% 0 1.96s 90 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6 7.0 10.0 66.7% 0 2.92s 536 0
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

त्वरित तुलना

तुलना जोड़ी बदलें