#117

Claude Sonnet 5

Anthropic Lançamento: 2026-06-30 Testado em: 2026-06-30 21:33 anthropic/claude-sonnet-5::none

(medium) (none)

Resumo

Claude Sonnet 5 marca 5.7 no AI BENCHY e fica em #117. Tem fiabilidade 10.0, taxa de acerto de 42.9%, custo total de $0.287 e tempo médio de resposta de 4.74s.

Pontuação

5.7

Consistência

8.6

Confiabilidade

10.0

Custo total (preço atual)

$0.287

Total de tokens de saída

13,325

Total de tokens de entrada

76,797

Preço de entrada

$2.000 / 1M

Preço de saída

$10.000 / 1M

Testes corretos

Testes errados: 14

Taxa de acerto por tentativa: 42.9%

Testes instáveis

Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).

Tempo de resposta (médio)

4.74s

Tempo de resposta (máx.): 29.46s

Tempo de resposta (total): 99.46s

Resposta incorreta: 7 Formatação extra: 4 Sem resposta: 2 Não seguiu as instruções: 1

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none

Custo: $0.061
Tempo: 53.7s
Tokens: 6,172 tok

Histórico de preços

Dados históricos de preços deste modelo da OpenRouter.

Data	Preço de entrada	Preço de saída
2026-06-30 21:35	$2.000 / 1M	$10.000 / 1M

Gráficos

Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.

Melhores modelos por pontuação

Pontuação vs Custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Comparação rápida

Claude Sonnet 5nonevsQwen3.5-Flashnone Claude Sonnet 5nonevsGemini 3.1 Flash Liteminimal Claude Sonnet 5nonevsGemma 4 31BnoneDisponível grátis Claude Sonnet 5nonevsGemini 2.5 Flashnone Claude Sonnet 5nonevsNemotron 3 Ultra 550b A55bnoneDisponível grátis Claude Sonnet 5nonevsGemini 3.5 Flashhigh Claude Sonnet 5nonevsGemini 3 Flash Previewmedium Claude Sonnet 5nonevsNemotron 3 Ultra 550b A55bmediumDisponível grátis Claude Sonnet 5nonevsGPT-5.5low

Detalhamento por categoria

Categoria	Pontuação	Consistência
Truques anti-IA	5.3	10.0
Programação	4.6	7.9
Combinado	3.0	10.0
Análise e extração de dados	10.0	10.0
Específico do domínio	5.3	7.2
Inteligência geral	4.7	3.1
Seguimento de instruções	6.4	10.0
Resolução de quebra-cabeças	6.0	7.4
Chamada de ferramentas	10.0	10.0
Conhecimentos gerais	3.0	10.0

Claude Sonnet 5

Hamster playing table tennis

#117 Claude Sonnet 5

Gráficos

Melhores modelos por pontuação

Pontuação vs Custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Comparação rápida

Detalhamento por categoria

Modelos comparados