AI BENCHY Compare
Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5
Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-03
| Métrica | Arcee AI: Trinity Large Preview (free) none Lanzamiento: 2026-01-27 Disponible gratis | MoonshotAI: Kimi K2.5 none Lanzamiento: 2026-01-27 |
|---|---|---|
| Rango | #33 | #35 |
| Puntaje prom. | 4.34 | 4.07 |
| Consistencia | 9.97 | 8.92 |
| Costo por resultado | 0.000 | 0.232 |
| Costo total | $0.000 | $0.010 |
| Pruebas correctas | 5/14 | 4/14 |
| Tasa de aciertos por intento | 35.7% | 35.7% |
| Pruebas inestables | 0 | 2 |
| Tokens de salida | 1,415 | 1,915 |
| Tokens de razonamiento | 0 | 0 |
Desglose por categoría
| Trucos anti-IA | Puntuación | Consistencia | Tasa de aciertos por intento | Pruebas inestables | Pruebas correctas | Tokens de salida | Tokens de razonamiento |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 1.00 | 10.00 | 0.0% | 0 | 587 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.67 | 7.86 | 11.1% | 1 | 363 | 0 |
| Análisis y extracción de datos | Puntuación | Consistencia | Tasa de aciertos por intento | Pruebas inestables | Pruebas correctas | Tokens de salida | Tokens de razonamiento |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 9.88 | 10.00 | 100.0% | 0 | 186 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.50 | 5.81 | 83.3% | 1 | 995 | 0 |
| Específico del dominio | Puntuación | Consistencia | Tasa de aciertos por intento | Pruebas inestables | Pruebas correctas | Tokens de salida | Tokens de razonamiento |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 10.00 | 33.3% | 0 | 21 | 0 | |
| MoonshotAI: Kimi K2.5 | 4.00 | 10.00 | 33.3% | 0 | 29 | 0 |
| Seguimiento de instrucciones | Puntuación | Consistencia | Tasa de aciertos por intento | Pruebas inestables | Pruebas correctas | Tokens de salida | Tokens de razonamiento |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 2.00 | 9.79 | 0.0% | 0 | 63 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.00 | 9.99 | 50.0% | 0 | 61 | 0 |
| Puzzle Solving | Puntuación | Consistencia | Tasa de aciertos por intento | Pruebas inestables | Pruebas correctas | Tokens de salida | Tokens de razonamiento |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 9.99 | 33.3% | 0 | 291 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.00 | 9.92 | 0.0% | 0 | 247 | 0 |
| Llamada de herramientas | Puntuación | Consistencia | Tasa de aciertos por intento | Pruebas inestables | Pruebas correctas | Tokens de salida | Tokens de razonamiento |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 10.00 | 10.00 | 100.0% | 0 | 267 | 0 | |
| MoonshotAI: Kimi K2.5 | 10.00 | 10.00 | 100.0% | 0 | 220 | 0 |
Comparación rápida
Cambiar par de comparación
Kimi K2.5nonevsGLM 4.7 FlashmediumTrinity Large Preview (free)noneDisponible gratisvsGLM 4.7 FlashmediumKimi K2.5nonevsQwen3 Coder NextmediumTrinity Large Preview (free)noneDisponible gratisvsQwen3 Coder NextmediumTrinity Large Preview (free)noneDisponible gratisvsMiniMax M2.5mediumTrinity Large Preview (free)noneDisponible gratisvsgpt-oss-120bmediumDisponible gratisTrinity Large Preview (free)noneDisponible gratisvsQwen3.5-FlashmediumTrinity Large Preview (free)noneDisponible gratisvsGPT-5 NanomediumMiniMax M2.5mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumDisponible gratisTrinity Large Preview (free)noneDisponible gratisvsQwen3.5-35B-A3BmediumTrinity Large Preview (free)noneDisponible gratisvsMiMo-V2-Flashmedium