नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Tencent: Hy3 preview

सारांश

Claude Opus 4.7 vs Hy3 preview benchmark तुलना: Claude Opus 4.7 average score में आगे है: 7.4 vs 6.8. Hy3 preview की benchmark लागत कम है: $0.059 vs $0.505. Claude Opus 4.7 तेज है: 3.02s vs 56.57s, pass rates 76.2% vs 55.6%.

अनुशंसित मॉडल: Claude Opus 4.7 - It has the best score here (7.4), while responding about 18.7x faster than Hy3 preview.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none रिलीज़: 2026-04-16 Hy3 preview Hy3 preview high रिलीज़: 2026-04-22
स्कोर 7.4 6.8
रैंक #49 #74
विश्वसनीयता 10.0 10.0
संगति 9.0 9.2
सही परीक्षण
प्रति प्रयास पास दर 76.2% 55.6%
अस्थिर टेस्ट 0 2
कुल रन 57 63
प्रति परिणाम लागत 3.154 0.000
कुल लागत $0.505 $0.059
इनपुट कीमत $5.000 / 1M $0.066 / 1M
आउटपुट कीमत $25.000 / 1M $0.260 / 1M
कुल इनपुट टोकन 69,576 25,987
आउटपुट टोकन 6,265 216,719
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 3.02s 56.57s
प्रतिक्रिया समय (अधिकतम) 18.27s 149.94s
प्रतिक्रिया समय (कुल) 57.44s 848.59s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#49 Claude Opus 4.7

none
लागत
$0.051
समय
24.2s
टोकन
2,181 tok

#74 Hy3 preview

high
Hy3 preview is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/tencent/hy3-preview
लागत
$0.000
समय
0.0s
टोकन
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 894 522 0
Hy3 preview 6.4 7.9 58.3% 1 15.12s 373 6,839 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.3 3.3 33.3% 0 2.84s 1,176 494 0
Hy3 preview 5.3 10.0 33.3% 0 99.76s 741 38,167 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 37,740 3,504 0
Hy3 preview 10.0 10.0 100.0% 0 113.09s 13,119 31,319 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 10,533 324 0
Hy3 preview 6.5 10.0 50.0% 0 12.11s 2,316 4,323 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 1,020 78 0
Hy3 preview 5.3 7.2 44.4% 1 109.04s 747 87,559 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 723 257 0
Hy3 preview 3.0 10.0 0.0% 0 0ms 0 0 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 939 114 0
Hy3 preview 10.0 10.0 100.0% 0 34.36s 675 13,483 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.46s 939 597 0
Hy3 preview 7.7 10.0 66.7% 0 27.94s 390 15,567 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 15,339 372 0
Hy3 preview 10.0 10.0 100.0% 0 78.83s 7,410 10,370 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.0 10.0 0.0% 0 1.46s 273 3 0
Hy3 preview 3.0 10.0 0.0% 0 47.71s 216 9,092 0

त्वरित तुलना

तुलना जोड़ी बदलें