नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs HY3 Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 HY3 Preview HY3 Preview high रिलीज़: 2026-04-22 निःशुल्क उपलब्ध
स्कोर 5.1 8.6
रैंक #117 #10
विश्वसनीयता लागू नहीं लागू नहीं
संगति 8.6 9.2
सही परीक्षण
प्रति प्रयास पास दर 35.2% 83.3%
अस्थिर टेस्ट 3 2
कुल रन 54 50
प्रति परिणाम लागत 0.630 0.000
कुल लागत $0.032 $0.000
???? ??? $0.750 / 1M $0.000 / 1M
????? ??? $4.500 / 1M $0.000 / 1M
आउटपुट टोकन 2,418 238,920
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.17s 55.19s
प्रतिक्रिया समय (अधिकतम) 2.52s 149.94s
प्रतिक्रिया समय (कुल) 21.01s 938.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
HY3 Preview 9.9 10.0 100.0% 0 34.02s 13,331 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0

त्वरित तुलना

तुलना जोड़ी बदलें