AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs MiniMax: MiniMax M2.7

Resumo

Comparação benchmark Claude Sonnet 5 vs MiniMax M2.7: Claude Sonnet 5 lidera na pontuação média com 5.7 vs 5.2. MiniMax M2.7 tem menor custo de benchmark com $0.075 vs $0.287. Claude Sonnet 5 é mais rápido com 4.74s vs 38.18s, com taxas de acerto de 42.9% vs 46.0%.

Modelo recomendado: Claude Sonnet 5 - Tem a melhor pontuação aqui (5.7) e responde cerca de 8.1x mais rápido que MiniMax M2.7.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-30

Métrica	Claude Sonnet 5 Claude Sonnet 5 none Lançamento: 2026-06-30	MiniMax M2.7 MiniMax M2.7 medium Lançamento: 2026-03-18

Métrica	Claude Sonnet 5 Claude Sonnet 5 none Lançamento: 2026-06-30	MiniMax M2.7 MiniMax M2.7 medium Lançamento: 2026-03-18
Pontuação	5.7	5.2
Posição	#117	#130
Confiabilidade	10.0	10.0
Consistência	8.6	6.8
Testes corretos
Taxa de acerto por tentativa	42.9%	46.0%
Testes instáveis	4	8
Execuções totais	63	63
Custo por resultado	4.098	2.494
Custo total	$0.287	$0.075
Preço de entrada	$2.000 / 1M	$0.180 / 1M
Preço de saída	$10.000 / 1M	$0.720 / 1M
Total de tokens de entrada	76,797	34,371
Tokens de saída	13,325	8,981
Tokens de raciocínio	0	89,812
Tempo de resposta (médio)	4.74s	38.18s
Tempo de resposta (máx.)	29.46s	196.21s
Tempo de resposta (total)	99.46s	763.60s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none

Custo: $0.061
Tempo: 53.7s
Tokens: 6,172 tok

#130 MiniMax M2.7

medium

Custo: $0.022
Tempo: 22.8s
Tokens: 9,250 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	5.3	10.0	25.0%	0		3.60s	834	1,813	0
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	4.6	7.9	22.2%	1		3.67s	10,590	1,864	0
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	3.0	10.0	0.0%	0		29.46s	38,775	6,340	0
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	14,233	369	4,480

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	10.0	10.0	100.0%	0		3.01s	10,503	309	0
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	5.3	7.2	44.4%	1		3.28s	975	933	0
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	4.7	3.1	33.3%	1		2.81s	708	272	0
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	6.4	10.0	50.0%	0		2.58s	909	103	0
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	6.0	7.4	55.6%	1		3.22s	894	778	0
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	10.0	10.0	100.0%	0		6.80s	12,351	522	0
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Sonnet 5	3.0	10.0	0.0%	0		4.31s	258	391	0
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452

Comparação rápida

Trocar par de comparação