नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 vs HY3 Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-30

मेट्रिक GPT-5.2 GPT-5.2 medium प्रकाशन: 2025-12-11 HY3 Preview HY3 Preview low प्रकाशन: 2026-04-22 मोफत उपलब्ध
स्कोअर 7.5 8.1
क्रमांक #53 #28
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 8.1 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 72.2% 75.9%
अस्थिर चाचण्या 4 1
एकूण रन 54 50
प्रति निकाल खर्च 3.193 0.000
एकूण खर्च $0.352 $0.000
???? ??? $1.750 / 1M $0.000 / 1M
????? ??? $14.000 / 1M $0.000 / 1M
आउटपुट टोकन्स 2,705 65,778
रिझनिंग टोकन्स 18,977 0
प्रतिसाद वेळ (सरासरी) 14.04s 23.98s
प्रतिसाद वेळ (कमाल) 77.80s 78.74s
प्रतिसाद वेळ (एकूण) 154.41s 407.72s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
HY3 Preview 10.0 10.0 100.0% 0 16.61s 7,905 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 15.12s 467 2,166
HY3 Preview 10.0 10.0 100.0% 0 27.94s 7,907 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
HY3 Preview 10.0 10.0 100.0% 0 78.74s 12,975 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
HY3 Preview 6.5 10.0 50.0% 0 5.85s 1,022 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
HY3 Preview 5.9 7.2 55.6% 1 40.44s 23,121 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
HY3 Preview 10.0 10.0 100.0% 0 16.44s 2,185 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
HY3 Preview 10.0 10.0 100.0% 0 15.98s 2,475 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 7.7 7.3 77.8% 1 5.47s 609 938
HY3 Preview 5.3 10.0 33.3% 0 13.73s 6,985 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
HY3 Preview 10.0 10.0 100.0% 0 17.84s 1,203 0

झटपट तुलना

तुलना जोडी बदला