GPT-5.3 Chat vs MiMo-V2.5 (medium)

Modelo recomendado GPT-5.3 Chat

Tem a melhor pontuação aqui (7.5) e responde cerca de 4.7x mais rápido que MiMo-V2.5 (medium).

Comparação detalhada

Métrica	GPT-5.3 Chat GPT-5.3 Chat none Lançamento: 2026-03-03	MiMo-V2.5 MiMo-V2.5 medium Lançamento: 2026-04-22

Métrica	GPT-5.3 Chat GPT-5.3 Chat none Lançamento: 2026-03-03	MiMo-V2.5 MiMo-V2.5 medium Lançamento: 2026-04-22
Pontuação	7.5	6.5
Posição	#62	#111
Confiabilidade	10.0	10.0
Consistência	8.2	7.9
Testes corretos
Taxa de acerto por tentativa	68.2%	69.7%
Testes instáveis	5	6
Execuções totais	66	66
Custo por resultado	4.387	3.124
Custo total	$0.571	$0.082
Preço de entrada	$1.750 / 1M	$0.140 / 1M
Preço de saída	$14.000 / 1M	$0.280 / 1M
Total de tokens de entrada	78,990	105,447
Tokens de saída	30,854	7,120
Tokens de raciocínio	0	230,682
Tempo de resposta (médio)	6.88s	32.20s
Tempo de resposta (máx.)	18.33s	162.44s
Tempo de resposta (total)	151.31s	708.46s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0
MiMo-V2.5	10.0	10.0	100.0%	0		4.14s	621	281	1,739

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0
MiMo-V2.5	6.2	4.7	66.7%	2		97.14s	7,422	557	81,977

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0
MiMo-V2.5	8.7	6.9	83.3%	1		77.97s	78,669	4,656	39,393

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0
MiMo-V2.5	2.7	5.7	16.7%	1		6.33s	7,746	306	5,714

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0
MiMo-V2.5	5.3	10.0	33.3%	0		34.53s	735	507	49,478

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0
MiMo-V2.5	5.4	2.5	66.7%	1		5.37s	492	121	418

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0
MiMo-V2.5	9.9	10.0	100.0%	0		1.80s	672	88	801

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0
MiMo-V2.5	8.2	7.2	88.9%	1		20.25s	660	279	33,254

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0
MiMo-V2.5	10.0	10.0	100.0%	0		7.29s	8,220	303	2,424

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0
MiMo-V2.5	3.0	10.0	0.0%	0		51.29s	210	22	15,484

Trocar par de comparação