Anthropic: Claude Opus 4.7 vs Anthropic: Claude Sonnet 4.6

Claude Opus 4.7 (medium) lidera na pontuação média com 8.7 vs 7.8. Claude Opus 4.7 (medium) tem menor custo de benchmark com $1.477 vs $2.057. Claude Opus 4.7 (medium) é mais rápido com 7.61s vs 25.91s, com taxas de acerto de 83.3% vs 66.7%.

Modelo recomendadoClaude Opus 4.7 (medium)Tem a melhor pontuação aqui (8.7) e responde cerca de 3.4x mais rápido que Claude Sonnet 4.6 (medium).

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-20

Métrica	Claude Opus 4.7 Claude Opus 4.7 medium Lançamento: 2026-04-16	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Lançamento: 2026-02-17

Métrica	Claude Opus 4.7 Claude Opus 4.7 medium Lançamento: 2026-04-16	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Lançamento: 2026-02-17
Pontuação	8.7	7.8
Posição	#15	#40
Confiabilidade	10.0	10.0
Consistência	9.6	9.2
Testes corretos
Taxa de acerto por tentativa	83.3%	66.7%
Testes instáveis	1	2
Execuções totais	66	66
Custo por resultado	8.201	14.692
Custo total	$1.477	$2.057
Preço de entrada	$5.000 / 1M	$3.000 / 1M
Preço de saída	$25.000 / 1M	$15.000 / 1M
Total de tokens de entrada	145,252	106,292
Tokens de saída	24,948	80,748
Tokens de raciocínio	5,042	35,117
Tempo de resposta (médio)	7.61s	25.91s
Tempo de resposta (máx.)	65.40s	140.96s
Tempo de resposta (total)	159.91s	362.78s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#15 Claude Opus 4.7

medium

Custo: $0.059
Tempo: 26.8s
Tokens: 2,475 tok

#40 Claude Sonnet 4.6

medium

SVG inválido

Custo: $0.000
Tempo: 300.0s
Tokens: 0 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586

Comparação rápida

Trocar par de comparação

Claude Sonnet 4.6mediumvsGPT-5.6 Lunahigh Claude Sonnet 4.6mediumvsGPT-5.6 Terrahigh Claude Sonnet 4.6mediumvsKimi K3max Claude Sonnet 4.6mediumvsDeepSeek V4 Flashhigh Claude Sonnet 4.6mediumvsDeepSeek V4 Prohigh Claude Sonnet 4.6mediumvsGLM 5.2high Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6mediumvsInklinghigh Claude Opus 4.7mediumvsGrok 4.5high Claude Opus 4.7mediumvsGemini 3.5 Flashlow Claude Sonnet 4.6mediumvsMuse Spark 1.1high Claude Opus 4.7mediumvsGrok 4.5low