नेविगेशन
AI BENCHY
तुलना करें चार्ट
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-4o-mini vs OpenAI: GPT-5.4

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक OpenAI: GPT-4o-mini none रिलीज़: 2024-07-18 OpenAI: GPT-5.4 none रिलीज़: 2026-03-05
रैंक #46 #44
औसत स्कोर 4.1 4.6
सही परीक्षण
संगति 10.0 8.9
प्रति परिणाम लागत 0.111 1.496
कुल लागत $0.005 $0.090
प्रति प्रयास पास दर 26.7% 44.4%
अस्थिर टेस्ट 0 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन 1,528 1,635
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 2.21s 1.46s
प्रतिक्रिया समय (अधिकतम) 7.58s 2.89s
प्रतिक्रिया समय (कुल) 17.69s 21.86s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-4o-mini 4.0 10.0 33.3% 0 1.83s 180 0
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-4o-mini 10.0 10.0 0.0% 0 7.58s 568 0
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-4o-mini 9.9 10.0 100.0% 0 1.27s 183 0
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-4o-mini 10.0 10.0 0.0% 0 637ms 15 0
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-4o-mini 4.5 10.0 0.0% 0 1.27s 69 0
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-4o-mini 2.3 10.0 0.0% 0 1.30s 308 0
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0

त्वरित तुलना

तुलना जोड़ी बदलें