नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs OpenAI: GPT-5 Mini

सारांश

GPT-5.4 Mini vs GPT-5 Mini benchmark तुलना: GPT-5 Mini average score में आगे है: 8.5 vs 8.0. GPT-5 Mini की benchmark लागत कम है: $0.159 vs $0.526. GPT-5.4 Mini तेज है: 22.34s vs 23.64s, pass rates 73.0% vs 63.5%.

अनुशंसित मॉडल: GPT-5 Mini - It has the best score here (8.5), while costing about 3.3x less than GPT-5.4 Mini.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17 GPT-5 Mini GPT-5 Mini medium रिलीज़: 2025-08-07
स्कोर 8.0 8.5
रैंक #31 #19
विश्वसनीयता 10.0 10.0
संगति 8.0 9.1
सही परीक्षण
प्रति प्रयास पास दर 73.0% 63.5%
अस्थिर टेस्ट 5 2
कुल रन 63 63
प्रति परिणाम लागत 4.381 1.319
कुल लागत $0.526 $0.159
इनपुट कीमत $0.750 / 1M $0.250 / 1M
आउटपुट कीमत $4.500 / 1M $2.000 / 1M
कुल इनपुट टोकन 34,116 37,100
आउटपुट टोकन 2,181 6,801
रीजनिंग टोकन 108,937 67,690
प्रतिक्रिया समय (औसत) 22.34s 23.64s
प्रतिक्रिया समय (अधिकतम) 138.75s 88.15s
प्रतिक्रिया समय (कुल) 469.20s 496.44s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#31 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

#19 GPT-5 Mini

medium
Cost
$0.007
Time
42.9s
Tokens
3,432 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 606 1,715 6,378
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
GPT-5 Mini 10.0 10.0 100.0% 0 27.63s 7,302 658 17,152
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 14,118 754 11,520
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 7,140 453 3,200
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 515 293 14,016
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 477 349 1,856
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 660 310 3,968
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 642 1,622 6,144
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 5,445 487 1,600
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 195 160 1,856

त्वरित तुलना

तुलना जोड़ी बदलें