#69
DeepSeek
Lançamento: 2025-12-01
Testado em: 2026-04-20 17:48
deepseek/deepseek-v3.2::none
(medium)
(none)
Preço de entrada
$0.252 / 1M
Preço de saída
$0.378 / 1M
Testes instáveis
4
Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).
12.09s
Tempo de resposta (máx.): 115.89s
Tempo de resposta (total): 217.56s
Histórico de execuções
| Testado em | Pontuação | Confiabilidade | Testes corretos | Custo total | Comparar |
|---|---|---|---|---|---|
| 2026-05-22 00:35 Suite alterada | 5.6 | 10.0 | $0.018 | Comparar | |
| 2026-05-08 15:31 Suite alterada | 5.7 | 10.0 | $0.016 | Comparar | |
| 2026-04-20 17:48 Primeira execução registrada | 6.1 | N/D | $0.016 | Execução atual |
Comparação de execuções
| Execução | Pontuação | Consistência | Confiabilidade | Testes corretos | Testes instáveis | Total de tokens de saída | Custo total | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-20 17:48 · Primeira execução registrada | 6.1 | 8.1 | N/D | 7/18 | 4 | 8,384 | $0.016 | 12.09s |
| 2026-05-22 00:35 · Suite alterada | 5.6 | 8.0 | 10.0 | 7/20 | 5 | 11,163 | $0.018 | 14.46s |
| Diferença | +0.6 | +0.1 | 0 | -1 | -2779 | -$0.002 | -2374ms |
Estas duas execuções usaram suites de benchmark diferentes, então as diferenças refletem tanto mudanças do modelo quanto da suite.
Gráficos
Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.
Pontuação vs Custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Comparação rápida
DeepSeek V3.2nonevsGLM 5V TurbononeDeepSeek V3.2nonevsOwl AlphamediumDeepSeek V3.2nonevsQwen3.5-FlashnoneDeepSeek V3.2nonevsQwen3.5 Plus 2026-04-20noneDeepSeek V3.2nonevsNemotron 3 SupermediumDisponível grátisDeepSeek V3.2nonevsQwen3.5-35B-A3BnoneDeepSeek V3.2nonevsGemini 3 Flash PreviewmediumDeepSeek V3.2nonevsGemini 3.5 FlashhighDeepSeek V3.2nonevsRing-2.6-1TmediumDeepSeek V3.2nonevsGemini 3.5 Flashlow
Detalhamento por categoria
| Categoria | Pontuação | Consistência | Testes corretos |
|---|---|---|---|
| Truques anti-IA | 3.2 | 9.8 | |
| Programação | 2.4 | 1.3 | |
| Combinado | 6.5 | 10.0 | |
| Análise e extração de dados | 6.3 | 5.8 | |
| Específico do domínio | 3.6 | 7.2 | |
| Inteligência geral | 10.0 | 10.0 | |
| Seguimento de instruções | 10.0 | 10.0 | |
| Resolução de quebra-cabeças | 8.5 | 7.5 | |
| Chamada de ferramentas | 10.0 | 10.0 |