Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Trinity Large Preview vs Cobuddy

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-03

Métrica Trinity Large Preview Trinity Large Preview none Lanzamiento: 2026-01-27 Cobuddy Cobuddy medium Lanzamiento: 2026-05-06
Puntuación 4.7 5.8
Rango #148 #116
Fiabilidad 10.0 10.0
Consistencia 9.3 7.4
Pruebas correctas
Tasa de aciertos por intento 23.3% 50.0%
Pruebas inestables 2 6
Ejecuciones totales 60 60
Costo por resultado 0.017 0.000
Costo total $0.008 $0.000
Precio de entrada $0.243 / 1M $0.000 / 1M
Precio de salida $0.243 / 1M $0.000 / 1M
Total de tokens de entrada 29,828 37,449
Tokens de salida 2,169 1,677
Tokens de razonamiento 0 116,703
Tiempo de respuesta (promedio) 2.98s 39.90s
Tiempo de respuesta (máximo) 14.34s 309.02s
Tiempo de respuesta (total) 56.57s 797.98s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 651 550 0
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 4.0 6.6 16.7% 1 14.34s 738 397 0
Cobuddy 4.1 5.1 33.3% 1 79.17s 4,726 358 30,138
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 12,053 294 0
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 6,900 186 0
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 738 25 0
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 498 104 0
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 3.5 10.0 0.0% 0 822ms 678 63 0
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 3.6 7.7 11.1% 1 1.97s 669 265 0
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 6,699 267 0
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 204 18 0
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863

Comparación rápida

Cambiar par de comparación