नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4 Nano

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 GPT-5.4 Nano GPT-5.4 Nano medium रिलीज़: 2026-03-17
रैंक #32 #28
स्कोर 7.3 7.4
संगति 9.6 9.0
प्रति परिणाम लागत 2.512 0.769
कुल लागत $0.252 $0.077
सही परीक्षण
प्रति प्रयास पास दर 62.8% 66.7%
अस्थिर टेस्ट 1 2
कुल रन 51 51
आउटपुट टोकन 6,910 2,474
रीजनिंग टोकन 0 54,516
प्रतिक्रिया समय (औसत) 5.12s 11.08s
प्रतिक्रिया समय (अधिकतम) 23.84s 94.06s
प्रतिक्रिया समय (कुल) 51.16s 188.39s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

त्वरित तुलना

तुलना जोड़ी बदलें