AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs OpenAI: GPT-5 Mini

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-24

Métrica	DeepSeek V4 Pro DeepSeek V4 Pro none Lançamento: 2026-04-24	GPT-5 Mini GPT-5 Mini medium Lançamento: 2025-08-07

Métrica	DeepSeek V4 Pro DeepSeek V4 Pro none Lançamento: 2026-04-24	GPT-5 Mini GPT-5 Mini medium Lançamento: 2025-08-07
Pontuação	6.7	7.0
Posição	#59	#52
Consistência	9.5	8.6
Testes corretos
Taxa de acerto por tentativa	51.9%	61.1%
Testes instáveis	1	3
Execuções totais	26	54
Custo por resultado	0.317	1.415
Custo total	$0.029	$0.128
Preço de entrada	$1.740 / 1M	$0.250 / 1M
Preço de saída	$3.480 / 1M	$2.000 / 1M
Tokens de saída	1,596	6,379
Tokens de raciocínio	0	53,482
Tempo de resposta (médio)	24.23s	23.98s
Tempo de resposta (máx.)	109.46s	88.15s
Tempo de resposta (total)	436.17s	431.56s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	4.8	10.0	25.0%	0		36.12s	221	0
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	1,715	6,378

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	10.0	10.0	100.0%	0		33.40s	246	0
GPT-5 Mini	10.0	10.0	100.0%	0		23.18s	483	4,160

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	9.5	10.0	100.0%	0		34.55s	826	0
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	10.0	10.0	100.0%	0		54.04s	65	0
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	453	3,200

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.74s	6	0
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	293	14,016

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	4.5	10.0	0.0%	0		6.06s	45	0
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	349	1,856

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	6.5	10.0	50.0%	0		3.57s	22	0
GPT-5 Mini	8.0	6.6	83.3%	1		15.66s	318	4,992

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	6.0	7.1	44.4%	1		28.25s	92	0
GPT-5 Mini	5.6	9.8	33.3%	0		14.09s	1,527	5,760

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
DeepSeek V4 Pro	10.0	10.0	100.0%	0		6.47s	73	0
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

Comparação rápida

Trocar par de comparação

DeepSeek V4 PrononevsGrok 4.1 Fastmedium DeepSeek V4 PrononevsNemotron 3 SupermediumDisponível grátis Gemma 4 31BnoneDisponível grátisvsGPT-5 Minimedium DeepSeek V4 PrononevsMercury 2medium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none DeepSeek V4 PrononevsGrok 4.20medium DeepSeek V4 PrononevsKimi K2.5medium DeepSeek V4 ProhighvsGPT-5 Minimedium GPT-5 MinimediumvsGLM 5none Claude Sonnet 4.6nonevsGPT-5 Minimedium DeepSeek V4 PrononevsGPT-5 Nanomedium GPT-5 MinimediumvsMiMo-V2-Omninone