AI BENCHY Compare

Mistral: Mistral Small 4 vs Qwen: Qwen3 Coder Next

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-04

Métrica	Mistral Small 4 Mistral Small 4 none Lançamento: 2026-03-16	Qwen3 Coder Next Qwen3 Coder Next none Lançamento: 2026-02-03

Métrica	Mistral Small 4 Mistral Small 4 none Lançamento: 2026-03-16	Qwen3 Coder Next Qwen3 Coder Next none Lançamento: 2026-02-03
Pontuação	5.3	5.0
Posição	#75	#79
Consistência	9.5	10.0
Testes corretos
Taxa de acerto por tentativa	33.3%	23.5%
Testes instáveis	1	0
Execuções totais	51	51
Custo por resultado	0.108	0.175
Custo total	$0.006	$0.007
Preço de entrada	$0.150 / 1M	$0.120 / 1M
Preço de saída	$0.600 / 1M	$0.750 / 1M
Tokens de saída	1,624	3,032
Tokens de raciocínio	0	0
Tempo de resposta (médio)	629ms	10.82s
Tempo de resposta (máx.)	1.72s	45.14s
Tempo de resposta (total)	10.70s	118.99s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Comparação rápida

Trocar par de comparação

MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsMistral Small 4none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Mistral Small 4nonevsQwen3 Coder Nextmedium Mistral Small 4nonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumDisponível grátisvsMistral Small 4none Mistral Small 4nonevsgpt-oss-120bmediumDisponível grátis Mistral Small 4nonevsQwen3.5-9Bmedium MiniMax M2.5mediumDisponível grátisvsQwen3 Coder Nextnone Mistral Small 4nonevsGrok 4.20 Multi Agent Betamedium gpt-oss-120bmediumDisponível grátisvsQwen3 Coder Nextnone