नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs HY3 Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-24

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium प्रकाशन: 2026-04-16 HY3 Preview HY3 Preview low प्रकाशन: 2026-04-22 मोफत उपलब्ध
स्कोअर 9.2 8.1
क्रमांक #3 #24
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 10.0 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 88.9% 75.9%
अस्थिर चाचण्या 0 1
एकूण रन 54 50
प्रति निकाल खर्च 2.790 0.000
एकूण खर्च $0.447 $0.000
???? ??? $5.000 / 1M $0.000 / 1M
????? ??? $25.000 / 1M $0.000 / 1M
आउटपुट टोकन्स 5,375 65,778
रिझनिंग टोकन्स 1,341 0
प्रतिसाद वेळ (सरासरी) 3.53s 23.98s
प्रतिसाद वेळ (कमाल) 21.45s 78.74s
प्रतिसाद वेळ (एकूण) 60.03s 407.72s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
HY3 Preview 10.0 10.0 100.0% 0 16.61s 7,905 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
HY3 Preview 10.0 10.0 100.0% 0 27.94s 7,907 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
HY3 Preview 10.0 10.0 100.0% 0 78.74s 12,975 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
HY3 Preview 6.5 10.0 50.0% 0 5.85s 1,022 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
HY3 Preview 5.9 7.2 55.6% 1 40.44s 23,121 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
HY3 Preview 10.0 10.0 100.0% 0 16.44s 2,185 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
HY3 Preview 10.0 10.0 100.0% 0 15.98s 2,475 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
HY3 Preview 5.3 10.0 33.3% 0 13.73s 6,985 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
HY3 Preview 10.0 10.0 100.0% 0 17.84s 1,203 0

झटपट तुलना

तुलना जोडी बदला