नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Hunter Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-15

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 Hunter Alpha Hunter Alpha medium रिलीज़: रिलीज़ तिथि अज्ञात
रैंक #23 #32
स्कोर 7.8 7.1
संगति 8.5 7.6
प्रति परिणाम लागत 3.163 0.000
कुल लागत $0.317 $0.000
सही परीक्षण
प्रति प्रयास पास दर 70.8% 68.8%
अस्थिर टेस्ट 3 5
कुल रन 48 48
आउटपुट टोकन 19,272 4,686
रीजनिंग टोकन 0 17,821
प्रतिक्रिया समय (औसत) 5.96s 10.71s
प्रतिक्रिया समय (अधिकतम) 18.33s 30.53s
प्रतिक्रिया समय (कुल) 95.30s 171.41s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 7.9 7.5 77.8% 1 4.72s 3,091 0
Hunter Alpha 8.2 7.2 88.9% 1 4.93s 441 1,003
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Hunter Alpha 4.7 1.6 66.7% 1 30.53s 792 3,456
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Hunter Alpha 10.0 10.0 100.0% 0 23.16s 1,488 8,017
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Hunter Alpha 3.0 10.0 0.0% 0 10.52s 892 2,406
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Hunter Alpha 7.0 3.7 66.7% 1 6.44s 116 260
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Hunter Alpha 9.9 10.0 100.0% 0 4.18s 208 465
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Hunter Alpha 6.1 4.7 66.7% 2 5.36s 441 1,310
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904

त्वरित तुलना

तुलना जोड़ी बदलें