नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Elephant

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 Elephant Elephant medium रिलीज़: 2026-04-14
स्कोर 5.1 5.2
रैंक #82 #77
संगति 8.6 9.6
सही परीक्षण
प्रति प्रयास पास दर 35.2% 29.6%
अस्थिर टेस्ट 3 1
कुल रन 54 54
प्रति परिणाम लागत 0.630 0.000
कुल लागत $0.032 $0.000
???? ??? $0.750 / 1M $0.000 / 1M
????? ??? $4.500 / 1M $0.000 / 1M
आउटपुट टोकन 2,418 2,596
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.17s 1.27s
प्रतिक्रिया समय (अधिकतम) 2.52s 3.70s
प्रतिक्रिया समय (कुल) 21.01s 22.82s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Elephant 6.6 10.0 50.0% 0 1.19s 815 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
Elephant 5.1 3.3 33.3% 1 1.30s 365 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Elephant 3.0 10.0 0.0% 0 3.70s 562 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Elephant 6.5 10.0 50.0% 0 979ms 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Elephant 3.0 10.0 0.0% 0 925ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Elephant 4.3 10.0 0.0% 0 920ms 105 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Elephant 9.8 10.0 100.0% 0 987ms 82 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Elephant 3.7 10.0 0.0% 0 867ms 166 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Elephant 3.0 10.0 0.0% 0 2.83s 231 0

त्वरित तुलना

तुलना जोड़ी बदलें