Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Cobuddy vs DeepSeek: DeepSeek V4 Flash

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-19

Métrica Cobuddy Cobuddy medium Lanzamiento: 2026-05-06 Disponible gratis DeepSeek V4 Flash DeepSeek V4 Flash none Lanzamiento: 2026-04-24 Disponible gratis
Puntuación 5.8 5.2
Rango #102 #127
Fiabilidad 9.9 10.0
Consistencia 6.9 9.2
Pruebas correctas
Tasa de aciertos por intento 54.4% 31.6%
Pruebas inestables 7 2
Ejecuciones totales 57 57
Costo por resultado 0.000 0.147
Costo total $0.000 $0.008
Precio de entrada $0.000 / 1M $0.112 / 1M
Precio de salida $0.000 / 1M $0.224 / 1M
Tokens de salida 1,648 4,464
Tokens de razonamiento 96,062 0
Tiempo de respuesta (promedio) 36.50s 28.01s
Tiempo de respuesta (máximo) 309.02s 111.96s
Tiempo de respuesta (total) 693.45s 532.17s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 8.7 7.9 91.7% 1 10.00s 98 4,666
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 174 0
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 4.3 1.1 66.7% 1 53.59s 343 9,678
DeepSeek V4 Flash 6.3 10.0 0.0% 0 24.04s 471 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 3.0 10.0 0.0% 0 47.38s 465 7,265
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 2,664 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 6.3 5.8 66.7% 1 17.36s 275 5,591
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 195 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 2.9 4.4 22.2% 2 128.15s 10 49,454
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 18 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 4.2 9.9 0.0% 0 23.23s 76 3,782
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 67 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 9.8 10.0 100.0% 0 11.60s 64 2,842
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 321 0
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 3.5 4.4 33.3% 2 12.91s 175 5,627
DeepSeek V4 Flash 3.1 7.3 11.1% 1 22.96s 207 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 10.0 10.0 100.0% 0 11.19s 133 294
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 327 0
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Cobuddy 3.0 10.0 0.0% 0 36.98s 9 6,863
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 20 0

Comparación rápida

Cambiar par de comparación