Anthropic: Claude Opus 4.7 vs Tencent: Hy3 preview
सारांश
Claude Opus 4.7 vs Hy3 preview benchmark तुलना: Claude Opus 4.7 average score में आगे है: 7.4 vs 6.8. Hy3 preview की benchmark लागत कम है: $0.059 vs $0.505. Claude Opus 4.7 तेज है: 3.02s vs 56.57s, pass rates 76.2% vs 55.6%.
अनुशंसित मॉडल: Claude Opus 4.7 - It has the best score here (7.4), while responding about 18.7x faster than Hy3 preview.
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18
मेट्रिक
Claude Opus 4.7Claude Opus 4.7noneसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।रिलीज़: 2026-04-16
Hy3 previewHy3 previewhighसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।रिलीज़: 2026-04-22
मेट्रिक
Claude Opus 4.7Claude Opus 4.7noneसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।रिलीज़: 2026-04-16
Hy3 previewHy3 previewhighसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।रिलीज़: 2026-04-22
स्कोर
7.4सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
6.8सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
रैंक
#49
#74
विश्वसनीयता
10.0पहले प्रयास की सफलता स्कोर: 10.0 का मतलब है सफल कॉल से पहले लक्ष्य API या रेट-लिमिट की कोई पुनः प्रयास योग्य विफलता नहीं; दर्ज विफलताएँ स्कोर घटाती हैं।…
10.0पहले प्रयास की सफलता स्कोर: 10.0 का मतलब है सफल कॉल से पहले लक्ष्य API या रेट-लिमिट की कोई पुनः प्रयास योग्य विफलता नहीं; दर्ज विफलताएँ स्कोर घटाती हैं।…
संगति
9.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
9.2संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
सही परीक्षण
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 3प्रतिक्रिया समय (औसत)3.02sप्रतिक्रिया समय (अधिकतम)18.27sप्रतिक्रिया समय (कुल)57.44sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।API त्रुटि: 7गलत उत्तर: 3प्रतिक्रिया समय (औसत)56.57sप्रतिक्रिया समय (अधिकतम)149.94sप्रतिक्रिया समय (कुल)848.59sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
प्रति प्रयास पास दर
76.2%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
55.6%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
अस्थिर टेस्ट
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
2अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कुल रन
57कुल रन…
63कुल रन…
प्रति परिणाम लागत
3.154यह बेंचमार्क के प्रति सही उत्तर की औसत लागत सेंट में दिखाता है (कम होना बेहतर है)।…
0.000यह बेंचमार्क के प्रति सही उत्तर की औसत लागत सेंट में दिखाता है (कम होना बेहतर है)।…
कुल लागत
$0.505कुल लागत (वर्तमान कीमत)…
$0.059कुल लागत (वर्तमान कीमत)…
इनपुट कीमत
$5.000 / 1Mइनपुट कीमत…
$0.066 / 1Mइनपुट कीमत…
आउटपुट कीमत
$25.000 / 1Mआउटपुट कीमत…
$0.260 / 1Mआउटपुट कीमत…
कुल इनपुट टोकन
69,576कुल इनपुट टोकन…
25,987कुल इनपुट टोकन…
आउटपुट टोकन
6,265आउटपुट टोकन…
216,719आउटपुट टोकन…
रीजनिंग टोकन
0रीजनिंग टोकन…
0रीजनिंग टोकन…
प्रतिक्रिया समय (औसत)
3.02sप्रतिक्रिया समय (औसत)…
56.57sप्रतिक्रिया समय (औसत)…
प्रतिक्रिया समय (अधिकतम)
18.27sप्रतिक्रिया समय (अधिकतम)…
149.94sप्रतिक्रिया समय (अधिकतम)…
प्रतिक्रिया समय (कुल)
57.44sप्रतिक्रिया समय (कुल)…
848.59sप्रतिक्रिया समय (कुल)…
जनरेशन शोकेस
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#49 Claude Opus 4.7
none
लागत
$0.051
समय
24.2s
टोकन
2,181 tok
#74 Hy3 preview
high
Hy3 preview is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/tencent/hy3-preview
लागत
$0.000
समय
0.0s
टोकन
0 tok
स्कोर
-
लागत
-
समय
-
टोकन
-
स्कोर के अनुसार शीर्ष मॉडल
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
एंटी-एआई ट्रिक्स
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
8.3सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
75.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 1प्रतिक्रिया समय (औसत)2.12sप्रतिक्रिया समय (अधिकतम)3.75sप्रतिक्रिया समय (कुल)8.50sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
2.12sप्रतिक्रिया समय (औसत)…
894कुल इनपुट टोकन…
522आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
6.4सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
7.9संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
58.3%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
1अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।API त्रुटि: 2प्रतिक्रिया समय (औसत)15.12sप्रतिक्रिया समय (अधिकतम)19.99sप्रतिक्रिया समय (कुल)45.37sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
15.12sप्रतिक्रिया समय (औसत)…
373कुल इनपुट टोकन…
6,839आउटपुट टोकन…
0रीजनिंग टोकन…
कोडिंग
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
3.3सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
3.3संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
33.3%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)2.84sप्रतिक्रिया समय (अधिकतम)2.84sप्रतिक्रिया समय (कुल)2.84sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
2.84sप्रतिक्रिया समय (औसत)…
1,176कुल इनपुट टोकन…
494आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
5.3सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
33.3%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।API त्रुटि: 2प्रतिक्रिया समय (औसत)99.76sप्रतिक्रिया समय (अधिकतम)99.76sप्रतिक्रिया समय (कुल)99.76sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
99.76sप्रतिक्रिया समय (औसत)…
741कुल इनपुट टोकन…
38,167आउटपुट टोकन…
0रीजनिंग टोकन…
संयुक्त
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
9.5सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)18.27sप्रतिक्रिया समय (अधिकतम)18.27sप्रतिक्रिया समय (कुल)18.27sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
18.27sप्रतिक्रिया समय (औसत)…
37,740कुल इनपुट टोकन…
3,504आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)113.09sप्रतिक्रिया समय (अधिकतम)113.09sप्रतिक्रिया समय (कुल)113.09sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
113.09sप्रतिक्रिया समय (औसत)…
13,119कुल इनपुट टोकन…
31,319आउटपुट टोकन…
0रीजनिंग टोकन…
डेटा पार्सिंग और निष्कर्षण
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)2.15sप्रतिक्रिया समय (अधिकतम)2.33sप्रतिक्रिया समय (कुल)4.29sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
2.15sप्रतिक्रिया समय (औसत)…
10,533कुल इनपुट टोकन…
324आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
6.5सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
50.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।API त्रुटि: 1प्रतिक्रिया समय (औसत)12.11sप्रतिक्रिया समय (अधिकतम)12.11sप्रतिक्रिया समय (कुल)12.11sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
12.11sप्रतिक्रिया समय (औसत)…
2,316कुल इनपुट टोकन…
4,323आउटपुट टोकन…
0रीजनिंग टोकन…
डोमेन-विशिष्ट
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
7.7सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
66.7%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 1प्रतिक्रिया समय (औसत)1.19sप्रतिक्रिया समय (अधिकतम)1.40sप्रतिक्रिया समय (कुल)3.58sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
1.19sप्रतिक्रिया समय (औसत)…
1,020कुल इनपुट टोकन…
78आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
5.3सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
7.2संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
44.4%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
1अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 2प्रतिक्रिया समय (औसत)109.04sप्रतिक्रिया समय (अधिकतम)149.94sप्रतिक्रिया समय (कुल)327.11sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
109.04sप्रतिक्रिया समय (औसत)…
747कुल इनपुट टोकन…
87,559आउटपुट टोकन…
0रीजनिंग टोकन…
Samanya Buddhimatta
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)3.47sप्रतिक्रिया समय (अधिकतम)3.47sप्रतिक्रिया समय (कुल)3.47sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
3.47sप्रतिक्रिया समय (औसत)…
723कुल इनपुट टोकन…
257आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
3.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
0.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।API त्रुटि: 1प्रतिक्रिया समय (औसत)0msप्रतिक्रिया समय (अधिकतम)0msप्रतिक्रिया समय (कुल)0msकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
0msप्रतिक्रिया समय (औसत)…
0कुल इनपुट टोकन…
0आउटपुट टोकन…
0रीजनिंग टोकन…
निर्देश पालन
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)1.46sप्रतिक्रिया समय (अधिकतम)1.68sप्रतिक्रिया समय (कुल)2.91sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
1.46sप्रतिक्रिया समय (औसत)…
939कुल इनपुट टोकन…
114आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)34.36sप्रतिक्रिया समय (अधिकतम)41.83sप्रतिक्रिया समय (कुल)68.73sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
34.36sप्रतिक्रिया समय (औसत)…
675कुल इनपुट टोकन…
13,483आउटपुट टोकन…
0रीजनिंग टोकन…
पहेली समाधान
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)2.46sप्रतिक्रिया समय (अधिकतम)3.72sप्रतिक्रिया समय (कुल)7.38sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
2.46sप्रतिक्रिया समय (औसत)…
939कुल इनपुट टोकन…
597आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
7.7सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
66.7%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।API त्रुटि: 1प्रतिक्रिया समय (औसत)27.94sप्रतिक्रिया समय (अधिकतम)45.06sप्रतिक्रिया समय (कुल)55.89sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
27.94sप्रतिक्रिया समय (औसत)…
390कुल इनपुट टोकन…
15,567आउटपुट टोकन…
0रीजनिंग टोकन…
टूल कॉलिंग
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)4.74sप्रतिक्रिया समय (अधिकतम)4.74sप्रतिक्रिया समय (कुल)4.74sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
4.74sप्रतिक्रिया समय (औसत)…
15,339कुल इनपुट टोकन…
372आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)78.83sप्रतिक्रिया समय (अधिकतम)78.83sप्रतिक्रिया समय (कुल)78.83sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
78.83sप्रतिक्रिया समय (औसत)…
7,410कुल इनपुट टोकन…
10,370आउटपुट टोकन…
0रीजनिंग टोकन…
सामान्य ज्ञान
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
इनपुट टोकन
आउटपुट टोकन
रीजनिंग टोकन
Claude Opus 4.7संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
3.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
0.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 1प्रतिक्रिया समय (औसत)1.46sप्रतिक्रिया समय (अधिकतम)1.46sप्रतिक्रिया समय (कुल)1.46sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
1.46sप्रतिक्रिया समय (औसत)…
273कुल इनपुट टोकन…
3आउटपुट टोकन…
0रीजनिंग टोकन…
Hy3 previewसंग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
3.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
0.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 1प्रतिक्रिया समय (औसत)47.71sप्रतिक्रिया समय (अधिकतम)47.71sप्रतिक्रिया समय (कुल)47.71sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…