नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-4o-mini vs OpenAI: GPT-5.4 Mini

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक GPT-4o-mini GPT-4o-mini none रिलीज़: 2024-07-18 GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17
रैंक #63 #66
स्कोर 5.0 4.8
संगति 10.0 8.6
प्रति परिणाम लागत 0.115 0.737
कुल लागत $0.005 $0.030
सही परीक्षण
प्रति प्रयास पास दर 23.5% 31.4%
अस्थिर टेस्ट 0 3
कुल रन 51 51
आउटपुट टोकन 1,600 2,085
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.94s 1.17s
प्रतिक्रिया समय (अधिकतम) 7.58s 2.52s
प्रतिक्रिया समय (कुल) 19.44s 19.82s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.8 10.0 25.0% 0 1.34s 186 0
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.0 10.0 0.0% 0 7.58s 568 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 10.0 10.0 100.0% 0 1.27s 183 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.0 10.0 0.0% 0 637ms 15 0
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.0 10.0 0.0% 0 909ms 66 0
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.8 10.0 0.0% 0 1.27s 69 0
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.7 10.0 0.0% 0 1.30s 308 0
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0

त्वरित तुलना

तुलना जोड़ी बदलें