Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-03

Métrica	Arcee AI: Trinity Large Preview (free) none Lançamento: 2026-01-27 Disponível grátis	MoonshotAI: Kimi K2.5 none Lançamento: 2026-01-27
Posição	#33	#35
Pontuação média	4.34	4.07
Consistência	9.97	8.92
Custo por resultado	0.000	0.232
Custo total	$0.000	$0.010
Testes corretos	5/14	4/14
Taxa de acerto por tentativa	35.7%	35.7%
Testes instáveis	0	2
Tokens de saída	1,415	1,915
Tokens de raciocínio	0	0

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
MoonshotAI: Kimi K2.5	2.67	7.86	11.1%	1		363	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
MoonshotAI: Kimi K2.5	5.50	5.81	83.3%	1		995	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
MoonshotAI: Kimi K2.5	4.00	10.00	33.3%	0		29	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
MoonshotAI: Kimi K2.5	5.00	9.99	50.0%	0		61	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
MoonshotAI: Kimi K2.5	2.00	9.92	0.0%	0		247	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		220	0

Comparação rápida

Trocar par de comparação

Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneDisponível grátisvsGLM 4.7 Flashmedium Kimi K2.5nonevsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponível grátisvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponível grátisvsMiniMax M2.5medium Trinity Large Preview (free)noneDisponível grátisvsgpt-oss-120bmediumDisponível grátis Trinity Large Preview (free)noneDisponível grátisvsQwen3.5-Flashmedium Trinity Large Preview (free)noneDisponível grátisvsGPT-5 Nanomedium MiniMax M2.5mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumDisponível grátis Trinity Large Preview (free)noneDisponível grátisvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneDisponível grátisvsMiMo-V2-Flashmedium