Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

North Mini Code vs Mistral: Mistral Small 4

Resumo

Comparação benchmark North Mini Code vs Mistral Small 4: A pontuação média está praticamente empatada em 5.1 vs 5.1. North Mini Code tem menor custo de benchmark com $0.000 vs $0.068. Mistral Small 4 é mais rápido com 9.40s vs 29.82s, com taxas de acerto de 19.1% vs 44.4%.

Modelo recomendado: Mistral Small 4 - Tem a melhor pontuação aqui (5.1) e responde cerca de 3.2x mais rápido que North Mini Code.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-18

Métrica North Mini Code North Mini Code none Lançamento: 2026-06-18 Disponível grátis Mistral Small 4 Mistral Small 4 medium Lançamento: 2026-03-16
Pontuação 5.1 5.1
Posição #131 #133
Confiabilidade 8.5 10.0
Consistência 9.9 6.9
Testes corretos
Taxa de acerto por tentativa 19.1% 44.4%
Testes instáveis 0 8
Execuções totais 57 63
Custo por resultado 0.000 1.344
Custo total $0.000 $0.068
Preço de entrada $0.000 / 1M $0.150 / 1M
Preço de saída $0.000 / 1M $0.600 / 1M
Total de tokens de entrada 43,264 42,576
Tokens de saída 8,278 24,184
Tokens de raciocínio 0 84,678
Tempo de resposta (médio) 29.82s 9.40s
Tempo de resposta (máx.) 159.85s 59.15s
Tempo de resposta (total) 626.26s 197.39s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 North Mini Code

none
Cost
$0.000
Time
266.1s
Tokens
63,551 tok

#133 Mistral Small 4

medium
Cost
$0.006
Time
47.9s
Tokens
9,857 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 3.0 10.0 0.0% 0 22.48s 402 4,075 0
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 708 4,055 4,778
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 3.9 10.0 0.0% 0 21.96s 7,119 504 0
Mistral Small 4 4.4 5.1 33.3% 2 39.98s 7,636 11,635 54,715
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 3.5 8.7 0.0% 0 159.85s 24,265 2,920 0
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 18,706 2,612 10,700
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 10.0 10.0 100.0% 0 28.00s 6,819 183 0
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 6,171 335 723
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 3.0 10.0 0.0% 0 14.73s 621 14 0
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 742 2,621 6,904
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 3.9 9.6 0.0% 0 34.77s 444 115 0
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 519 821 828
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 6.5 10.0 50.0% 0 30.68s 597 57 0
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 729 540 1,031
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 3.5 10.0 0.0% 0 24.43s 435 353 0
Mistral Small 4 3.4 9.7 0.0% 0 2.17s 735 1,226 2,632
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 9.5 10.0 100.0% 0 3.64s 2,403 51 0
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 6,420 321 810
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
North Mini Code 3.0 10.0 0.0% 0 37.37s 159 6 0
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 210 18 1,557

Comparação rápida

Trocar par de comparação