Comparar Gráficos Metodologia

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs MoonshotAI: Kimi K2.5

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica	Trinity Large Preview none Lançamento: 2026-01-27 Disponível grátis	MoonshotAI: Kimi K2.5 none Lançamento: 2026-01-27
Posição	#45	#46
Pontuação média	4.2	4.1
Consistência	9.6	8.6
Custo por resultado	0.000	0.295
Custo total	$0.000	$0.015
Testes corretos
Taxa de acerto por tentativa	33.3%	39.6%
Testes instáveis	1	3
Execuções totais	48 (16 x 3)	48 (16 x 3)
Tokens de saída	1,837	2,000
Tokens de raciocínio	0	0
Tempo de resposta (médio)	3.15s	11.91s
Tempo de resposta (máx.)	8.91s	42.13s
Tempo de resposta (total)	50.46s	107.16s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
MoonshotAI: Kimi K2.5	2.7	7.9	11.1%	1		11.38s	363	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
MoonshotAI: Kimi K2.5	10.0	2.1	33.3%	1		19.16s	748	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
MoonshotAI: Kimi K2.5	5.4	5.8	83.3%	1		42.13s	187	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
MoonshotAI: Kimi K2.5	4.0	10.0	33.3%	0		4.38s	29	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
MoonshotAI: Kimi K2.5	10.0	10.0	100.0%	0		4.00s	76	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
MoonshotAI: Kimi K2.5	5.5	10.0	50.0%	0		2.67s	60	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
MoonshotAI: Kimi K2.5	10.0	10.0	0.0%	0		4.73s	317	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
MoonshotAI: Kimi K2.5	10.0	10.0	100.0%	0		13.99s	220	0

Comparação rápida

Trocar par de comparação

Trinity Large PreviewnoneDisponível grátisvsMiniMax M2.5medium Kimi K2.5nonevsQwen3 Coder Nextmedium MiniMax M2.5mediumvsKimi K2.5none Trinity Large PreviewnoneDisponível grátisvsQwen3 Coder Nextmedium Trinity Large PreviewnoneDisponível grátisvsgpt-oss-120bmediumDisponível grátis Kimi K2.5nonevsGLM 4.7 Flashmedium Kimi K2.5nonevsgpt-oss-120bmediumDisponível grátis Trinity Large PreviewnoneDisponível grátisvsMercury 2medium Trinity Large PreviewnoneDisponível grátisvsGLM 4.7 Flashmedium Mercury 2mediumvsKimi K2.5none Trinity Large PreviewnoneDisponível grátisvsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneDisponível grátisvsGPT-5 Nanomedium