AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-04-20 vs Xiaomi: MiMo-V2.5-Pro

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-27

Métrica	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Lançamento: 2026-04-20	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lançamento: 2026-04-22

Métrica	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Lançamento: 2026-04-20	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lançamento: 2026-04-22
Pontuação	8.1	8.1
Posição	#32	#30
Confiabilidade	9.7	N/D
Consistência	9.0	8.8
Testes corretos
Taxa de acerto por tentativa	77.8%	75.9%
Testes instáveis	2	3
Execuções totais	54	54
Custo por resultado	2.065	1.674
Custo total	$0.269	$0.201
Preço de entrada	$0.400 / 1M	$1.000 / 1M
Preço de saída	$2.400 / 1M	$3.000 / 1M
Tokens de saída	2,179	2,735
Tokens de raciocínio	103,832	52,571
Tempo de resposta (médio)	32.81s	16.17s
Tempo de resposta (máx.)	92.41s	84.22s
Tempo de resposta (total)	590.65s	291.09s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		10.84s	215	7,748
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		2.95s	273	1,363

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	7.6	10.0	100.0%	0		85.72s	248	11,081
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		32.58s	543	7,485

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		92.41s	483	17,490
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	348	11,870

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		38.32s	270	14,668
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	260	8,383

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	2.9	7.2	11.1%	1		53.10s	63	28,414
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	275	17,023

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	4.9	9.6	0.0%	0		25.30s	125	4,792
MiMo-V2.5-Pro	5.1	3.3	33.3%	1		4.27s	150	549

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		20.25s	103	7,689
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	82	803

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	8.2	7.2	88.9%	1		17.58s	324	9,786
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.16s	493	2,187

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		14.72s	348	2,164
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	311	2,908

Comparação rápida

Trocar par de comparação

Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-04-20medium Gemini 3 Flash PreviewnonevsMiMo-V2.5-Promedium HY3 PreviewlowDisponível grátisvsMiMo-V2.5-Promedium Gemini 3 Flash PreviewnonevsQwen3.5 Plus 2026-04-20medium Qwen3.5 Plus 2026-04-20mediumvsHY3 PreviewlowDisponível grátis GPT-5.2 ChatnonevsQwen3.5 Plus 2026-04-20medium GPT-5.2 ChatnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5 Plus 2026-04-20medium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5-Promedium DeepSeek V4 FlashhighvsQwen3.5 Plus 2026-04-20medium DeepSeek V4 FlashhighvsMiMo-V2.5-Promedium