नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Elephant

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Elephant Elephant medium रिलीज़: 2026-04-14
स्कोर 5.9 5.2
रैंक #63 #77
संगति 9.1 9.6
सही परीक्षण
प्रति प्रयास पास दर 42.6% 29.6%
अस्थिर टेस्ट 2 1
कुल रन 54 54
प्रति परिणाम लागत 1.477 0.000
कुल लागत $0.104 $0.000
???? ??? $2.500 / 1M $0.000 / 1M
????? ??? $15.000 / 1M $0.000 / 1M
आउटपुट टोकन 2,317 2,596
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.51s 1.27s
प्रतिक्रिया समय (अधिकतम) 2.95s 3.70s
प्रतिक्रिया समय (कुल) 27.21s 22.82s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Elephant 6.6 10.0 50.0% 0 1.19s 815 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Elephant 5.1 3.3 33.3% 1 1.30s 365 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Elephant 3.0 10.0 0.0% 0 3.70s 562 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Elephant 6.5 10.0 50.0% 0 979ms 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Elephant 3.0 10.0 0.0% 0 925ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Elephant 4.3 10.0 0.0% 0 920ms 105 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Elephant 9.8 10.0 100.0% 0 987ms 82 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Elephant 3.7 10.0 0.0% 0 867ms 166 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Elephant 3.0 10.0 0.0% 0 2.83s 231 0

त्वरित तुलना

तुलना जोड़ी बदलें