नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.5 vs HY3 Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-24

मेट्रिक GPT-5.5 GPT-5.5 none रिलीज़: 2026-04-24 HY3 Preview HY3 Preview high रिलीज़: 2026-04-22 निःशुल्क उपलब्ध
स्कोर 6.8 8.5
रैंक #58 #10
विश्वसनीयता लागू नहीं लागू नहीं
संगति 8.3 8.8
सही परीक्षण
प्रति प्रयास पास दर 61.1% 81.5%
अस्थिर टेस्ट 4 3
कुल रन 54 50
प्रति परिणाम लागत 2.162 0.000
कुल लागत $0.195 $0.000
???? ??? $5.000 / 1M $0.000 / 1M
????? ??? $30.000 / 1M $0.000 / 1M
आउटपुट टोकन 1,910 238,920
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.83s 55.19s
प्रतिक्रिया समय (अधिकतम) 5.56s 149.94s
प्रतिक्रिया समय (कुल) 32.86s 938.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.9 7.9 66.7% 1 1.31s 213 0
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 2.05s 426 0
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 5.56s 300 0
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 1.18s 222 0
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 2.9 7.2 11.1% 1 1.31s 52 0
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.41s 124 0
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.2 5.8 66.7% 1 1.15s 81 0
HY3 Preview 8.5 6.8 83.3% 1 34.02s 13,331 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.7 7.9 55.6% 1 1.36s 245 0
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.90s 247 0
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0

त्वरित तुलना

तुलना जोड़ी बदलें