AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Tencent: Hy3 preview

Rezumat

Comparație benchmark Claude Opus 4.7 vs Hy3 preview: Claude Opus 4.7 conduce la scorul mediu cu 8.7 vs 6.8. Hy3 preview are costul de benchmark mai mic, $0.059 vs $0.679. Claude Opus 4.7 este mai rapid cu 4.73s vs 56.57s, cu rate de reușită de 82.5% vs 55.6%.

Model recomandat: Claude Opus 4.7 - Are cel mai bun scor aici (8.7) și răspunde de aproximativ 12.0x mai rapid decât Hy3 preview.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică	Claude Opus 4.7 Claude Opus 4.7 medium Lansare: 2026-04-16	Hy3 preview Hy3 preview high Lansare: 2026-04-22

Metrică	Claude Opus 4.7 Claude Opus 4.7 medium Lansare: 2026-04-16	Hy3 preview Hy3 preview high Lansare: 2026-04-22
Scor	8.7	6.8
Rang	#13	#74
Fiabilitate	10.0	10.0
Consistență	9.6	9.2
Teste corecte
Rată de trecere pe încercare	82.5%	55.6%
Teste instabile	1	2
Rulări totale	63	63
Cost per rezultat	3.991	0.000
Cost total	$0.679	$0.059
Preț de intrare	$5.000 / 1M	$0.066 / 1M
Preț de ieșire	$25.000 / 1M	$0.260 / 1M
Total tokenuri de intrare	65,406	25,987
Tokenuri de ieșire	11,858	216,719
Tokenuri de raționament	2,198	0
Timp de răspuns (mediu)	4.73s	56.57s
Timp de răspuns (maxim)	23.18s	149.94s
Timp de răspuns (total)	94.51s	848.59s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#13 Claude Opus 4.7

medium

Cost: $0.059
Timp: 26.8s
Tokenuri: 2,475 tok

#74 Hy3 preview

high

Hy3 preview is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/tencent/hy3-preview

Cost: $0.000
Timp: 0.0s
Tokenuri: 0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Hy3 preview	6.4	7.9	58.3%	1		15.12s	373	6,839	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Hy3 preview	5.3	10.0	33.3%	0		99.76s	741	38,167	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	10.0	10.0	100.0%	0		21.45s	24,501	2,369	1,084
Hy3 preview	10.0	10.0	100.0%	0		113.09s	13,119	31,319	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Hy3 preview	6.5	10.0	50.0%	0		12.11s	2,316	4,323	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Hy3 preview	5.3	7.2	44.4%	1		109.04s	747	87,559	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Hy3 preview	3.0	10.0	0.0%	0		0ms	0	0	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Hy3 preview	10.0	10.0	100.0%	0		34.36s	675	13,483	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Hy3 preview	7.7	10.0	66.7%	0		27.94s	390	15,567	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Hy3 preview	10.0	10.0	100.0%	0		78.83s	7,410	10,370	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Hy3 preview	3.0	10.0	0.0%	0		47.71s	216	9,092	0

Comparație rapidă

Schimbă perechea de comparație

Claude Opus 4.7mediumvsGPT-5.2 Chatnone Claude Opus 4.7mediumvsDeepSeek V4 Flashhigh Claude Opus 4.7mediumvsGemini 3.5 Flashlow Claude Opus 4.7mediumvsGPT-5.5low Claude Opus 4.7mediumvsStep 3.7 Flashlow Claude Opus 4.7mediumvsDeepSeek V4 Prohigh Claude Opus 4.7mediumvsGemini 3.5 Flashhigh Claude Opus 4.7mediumvsGPT-5.3 Chatnone Claude Opus 4.7mediumvsGemini 3 Flash Previewlow Claude Opus 4.7mediumvsDeepSeek V4 Pronone Claude Opus 4.7mediumvsQwen3.7 Plusnone Claude Opus 4.7mediumvsGLM 5.2none