AI BENCHY Compare

Cobuddy vs Mistral: Mistral Small 4

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica	Cobuddy Cobuddy medium Lançamento: 2026-05-06 Disponível grátis	Mistral Small 4 Mistral Small 4 medium Lançamento: 2026-03-16

Métrica	Cobuddy Cobuddy medium Lançamento: 2026-05-06 Disponível grátis	Mistral Small 4 Mistral Small 4 medium Lançamento: 2026-03-16
Pontuação	5.7	5.4
Posição	#105	#121
Confiabilidade	9.9	10.0
Consistência	7.0	7.1
Testes corretos
Taxa de acerto por tentativa	51.7%	45.0%
Testes instáveis	7	7
Execuções totais	60	60
Custo por resultado	0.000	1.109
Custo total	$0.000	$0.056
Preço de entrada	$0.000 / 1M	$0.150 / 1M
Preço de saída	$0.000 / 1M	$0.600 / 1M
Tokens de saída	1,663	21,628
Tokens de raciocínio	116,522	68,055
Tempo de resposta (médio)	39.91s	8.33s
Tempo de resposta (máx.)	309.02s	59.15s
Tempo de resposta (total)	798.21s	166.59s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	8.7	7.9	91.7%	1		10.00s	98	4,666
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	4,055	4,778

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	4.1	5.1	33.3%	1		79.17s	358	30,138
Mistral Small 4	5.1	6.8	33.3%	1		44.82s	9,322	38,386

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	3.0	10.0	0.0%	0		47.38s	465	7,265
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	2,612	10,700

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	6.3	5.8	66.7%	1		17.36s	275	5,591
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	335	723

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	2.9	4.4	22.2%	2		128.15s	10	49,454
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	2,621	6,904

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	4.2	9.9	0.0%	0		23.23s	76	3,782
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	821	828

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	9.8	10.0	100.0%	0		11.60s	64	2,842
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	540	1,031

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	3.5	4.4	33.3%	2		12.91s	175	5,627
Mistral Small 4	3.4	9.7	0.0%	0		2.00s	983	2,338

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	10.0	10.0	100.0%	0		11.19s	133	294
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	321	810

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Cobuddy	3.0	10.0	0.0%	0		36.98s	9	6,863
Mistral Small 4	3.0	10.0	0.0%	0		5.92s	18	1,557

Comparação rápida

Trocar par de comparação

CobuddymediumDisponível grátisvsOwl Alphanone Mistral Small 4mediumvsGrok 4.20none Mistral Small 4mediumvsQwen3.5-122B-A10Bnone CobuddymediumDisponível grátisvsQwen3.6 27Bnone CobuddymediumDisponível grátisvsQwen3.5-27Bnone CobuddymediumDisponível grátisvsMiMo-V2-Pronone CobuddymediumDisponível grátisvsQwen3.5-35B-A3Bnone CobuddymediumDisponível grátisvsQwen3.5 Plus 2026-04-20none Mistral Small 4mediumvsGLM 5 Turbonone Mistral Small 4mediumvsKimi K2.5none CobuddymediumDisponível grátisvsGLM 4.7 Flashnone Ling-2.6-flashnonevsMistral Small 4medium