Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-03

Métrica	Arcee AI: Trinity Large Preview (free) none Lanzamiento: 2026-01-27 Disponible gratis	MoonshotAI: Kimi K2.5 none Lanzamiento: 2026-01-27
Rango	#33	#35
Puntaje prom.	4.34	4.07
Consistencia	9.97	8.92
Costo por resultado	0.000	0.232
Costo total	$0.000	$0.010
Pruebas correctas	5/14	4/14
Tasa de aciertos por intento	35.7%	35.7%
Pruebas inestables	0	2
Tokens de salida	1,415	1,915
Tokens de razonamiento	0	0

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
MoonshotAI: Kimi K2.5	2.67	7.86	11.1%	1		363	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
MoonshotAI: Kimi K2.5	5.50	5.81	83.3%	1		995	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
MoonshotAI: Kimi K2.5	4.00	10.00	33.3%	0		29	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
MoonshotAI: Kimi K2.5	5.00	9.99	50.0%	0		61	0

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
MoonshotAI: Kimi K2.5	2.00	9.92	0.0%	0		247	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		220	0

Comparación rápida

Cambiar par de comparación

Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneDisponible gratisvsGLM 4.7 Flashmedium Kimi K2.5nonevsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponible gratisvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponible gratisvsMiniMax M2.5medium Trinity Large Preview (free)noneDisponible gratisvsgpt-oss-120bmediumDisponible gratis Trinity Large Preview (free)noneDisponible gratisvsQwen3.5-Flashmedium Trinity Large Preview (free)noneDisponible gratisvsGPT-5 Nanomedium MiniMax M2.5mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumDisponible gratis Trinity Large Preview (free)noneDisponible gratisvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneDisponible gratisvsMiMo-V2-Flashmedium