#51
DeepSeek
Lançamento: 2026-04-24
Testado em: 2026-04-29 14:47
deepseek/deepseek-v4-pro::high
(high)
(none)
Preço de entrada
$0.435 / 1M
Preço de saída
$0.870 / 1M
Testes instáveis
4
Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).
60.03s
Tempo de resposta (máx.): 358.35s
Tempo de resposta (total): 1080.60s
Histórico de execuções
| Testado em | Pontuação | Confiabilidade | Testes corretos | Custo total | Comparar |
|---|---|---|---|---|---|
| 2026-05-22 00:54 Suite alterada | 6.6 | 9.0 | $0.212 | Comparar | |
| 2026-04-29 14:47 Novo teste | 7.5 | 9.3 | $0.209 | Execução atual | |
| 2026-04-26 10:50 Novo teste | 7.5 | 8.4 | $0.201 | Comparar | |
| 2026-04-25 21:53 Execução inicial | 8.2 | N/D | $0.329 | Comparar |
Comparação de execuções
| Execução | Pontuação | Consistência | Confiabilidade | Testes corretos | Testes instáveis | Total de tokens de saída | Custo total | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-29 14:47 · Novo teste | 7.5 | 8.0 | 9.3 | 11/18 | 4 | 62,125 | $0.209 | 60.03s |
| 2026-04-26 10:50 · Novo teste | 7.5 | 8.0 | 8.4 | 11/18 | 4 | 57,875 | $0.201 | 60.02s |
| Diferença | 0.0 | 0.0 | +0.9 | 0 | 0 | +4250 | +$0.008 | +17ms |
Gráficos
Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.
Pontuação vs Custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Comparação rápida
DeepSeek V4 ProhighvsMiMo-V2-FlashmediumDeepSeek V4 ProhighvsClaude Sonnet 4.6noneDeepSeek V4 ProhighvsQwen3.6 Max PreviewnoneDeepSeek V4 ProhighvsDeepSeek V3.2mediumDeepSeek V4 ProhighvsGPT-5 MinimediumDeepSeek V4 ProhighvsGrok 4.20mediumDeepSeek V4 ProhighvsGemini 3 Flash PreviewmediumDeepSeek V4 ProhighvsGemini 3.5 FlashhighDeepSeek V4 ProhighvsRing-2.6-1TmediumDeepSeek V4 ProhighvsGemini 3.5 Flashlow
Detalhamento por categoria
| Categoria | Pontuação | Consistência | Testes corretos |
|---|---|---|---|
| Truques anti-IA | 8.3 | 10.0 | |
| Programação | 3.0 | 0.0 | |
| Combinado | 10.0 | 10.0 | |
| Análise e extração de dados | 10.0 | 10.0 | |
| Específico do domínio | 3.2 | 6.9 | |
| Inteligência geral | 6.1 | 3.1 | |
| Seguimento de instruções | 10.0 | 10.0 | |
| Resolução de quebra-cabeças | 8.0 | 7.0 | |
| Chamada de ferramentas | 10.0 | 10.0 |