#112
DeepSeek
Lançamento: 2026-04-24
Testado em: 2026-04-24 09:19
deepseek/deepseek-v4-pro::none
(high)
(none)
3.1
Consistência
7.2
$0.009
Total de tokens de saída
591
Preço de entrada
$1.740 / 1M
Preço de saída
$3.480 / 1M
Testes instáveis
6
Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).
44.40s
Tempo de resposta (máx.): 125.71s
Tempo de resposta (total): 577.18s
Histórico de execuções
| Testado em | Pontuação | Confiabilidade | Testes corretos | Custo total | Comparar |
|---|---|---|---|---|---|
| 2026-05-22 00:38 Suite alterada | 6.0 | 8.1 | $0.046 | Comparar | |
| 2026-04-29 14:46 Novo teste | 6.2 | 7.9 | $0.043 | Comparar | |
| 2026-04-24 09:19 Execução inicial | 3.1 | N/D | $0.009 | Execução atual |
Comparação de execuções
| Execução | Pontuação | Consistência | Confiabilidade | Testes corretos | Testes instáveis | Total de tokens de saída | Custo total | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-24 09:19 · Execução inicial | 3.1 | 7.2 | N/D | 0/18 | 6 | 591 | $0.009 | 44.40s |
| 2026-04-29 14:46 · Novo teste | 6.2 | 8.7 | 7.9 | 7/18 | 3 | 3,903 | $0.043 | 14.01s |
| Diferença | -3.1 | -1.5 | -7 | +3 | -3312 | -$0.034 | +30391ms |
Gráficos
Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.
Pontuação vs Custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Comparação rápida
DeepSeek V4 PrononevsGemini 3.1 Flash LiteminimalDeepSeek V4 PrononevsMiMo-V2-OmnimediumDeepSeek V4 PrononevsKimi K2.5mediumDeepSeek V4 PrononevsGrok 4.20mediumDeepSeek V4 PrononevsGemini 3 Flash PreviewmediumDeepSeek V4 PrononevsGemini 3.5 FlashhighDeepSeek V4 PrononevsRing-2.6-1TmediumDeepSeek V4 PrononevsGemini 3.5 Flashlow
Detalhamento por categoria
| Categoria | Pontuação | Consistência | Testes corretos |
|---|---|---|---|
| Truques anti-IA | 3.1 | 10.0 | |
| Programação | 2.8 | 1.6 | |
| Combinado | 3.0 | 10.0 | |
| Análise e extração de dados | 2.8 | 1.6 | |
| Específico do domínio | 3.0 | 10.0 | |
| Inteligência geral | 3.4 | 9.6 | |
| Seguimento de instruções | 3.3 | 6.1 | |
| Resolução de quebra-cabeças | 3.6 | 4.3 | |
| Chamada de ferramentas | 3.0 | 10.0 |