Navegación
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs inclusionAI: Ling-2.6-1T

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-29

Métrica DeepSeek V4 Flash DeepSeek V4 Flash none Lanzamiento: 2026-04-24 Disponible gratis Ling-2.6-1T Ling-2.6-1T none Lanzamiento: 2026-04-23
Puntuación 5.1 4.5
Rango #137 #153
Fiabilidad 10.0 N/D
Consistencia 8.8 10.0
Pruebas correctas
Tasa de aciertos por intento 31.7% 16.7%
Pruebas inestables 3 0
Ejecuciones totales 60 60
Costo por resultado 0.198 0.000
Costo total $0.010 $0.000
Precio de entrada $0.100 / 1M $0.075 / 1M
Precio de salida $0.200 / 1M $0.625 / 1M
Tokens de salida 13,700 2,434
Tokens de razonamiento 0 0
Tiempo de respuesta (promedio) 27.97s 7.72s
Tiempo de respuesta (máximo) 111.96s 25.72s
Tiempo de respuesta (total) 559.36s 139.00s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 174 0
Ling-2.6-1T 3.4 10.0 0.0% 0 6.55s 777 0
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 4.8 6.0 16.7% 1 24.47s 9,707 0
Ling-2.6-1T 5.5 10.0 0.0% 0 10.57s 381 0
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 2,664 0
Ling-2.6-1T 3.0 10.0 0.0% 0 23.53s 183 0
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 195 0
Ling-2.6-1T 10.0 10.0 100.0% 0 1.37s 285 0
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 18 0
Ling-2.6-1T 3.0 10.0 0.0% 0 1.04s 27 0
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 67 0
Ling-2.6-1T 5.0 10.0 0.0% 0 20.34s 140 0
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 321 0
Ling-2.6-1T 6.4 10.0 50.0% 0 5.36s 81 0
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 3.1 7.3 11.1% 1 23.72s 207 0
Ling-2.6-1T 3.1 10.0 0.0% 0 5.36s 131 0
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 327 0
Ling-2.6-1T 3.0 10.0 0.0% 0 25.72s 429 0
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 20 0
Ling-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0

Comparación rápida

Cambiar par de comparación