AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs OpenAI: GPT-4o-mini

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-19

Métrica	Ring-2.6-1T Ring-2.6-1T medium Lanzamiento: 2026-05-10	GPT-4o-mini GPT-4o-mini none Lanzamiento: 2024-07-18

Métrica	Ring-2.6-1T Ring-2.6-1T medium Lanzamiento: 2026-05-10	GPT-4o-mini GPT-4o-mini none Lanzamiento: 2024-07-18
Puntuación	7.2	4.9
Rango	#60	#134
Fiabilidad	9.9	10.0
Consistencia	8.7	9.9
Pruebas correctas
Tasa de aciertos por intento	66.7%	26.3%
Pruebas inestables	3	0
Ejecuciones totales	57	57
Costo por resultado	0.000	0.099
Costo total	$0.000	$0.005
Precio de entrada	$0.075 / 1M	$0.150 / 1M
Precio de salida	$0.625 / 1M	$0.600 / 1M
Tokens de salida	21,752	1,962
Tokens de razonamiento	42,754	0
Tiempo de respuesta (promedio)	61.29s	1.90s
Tiempo de respuesta (máximo)	304.19s	7.58s
Tiempo de respuesta (total)	1164.50s	22.79s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	10.0	10.0	100.0%	0		42.21s	3,833	4,891
GPT-4o-mini	4.8	10.0	25.0%	0		1.34s	186	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	10.0	10.0	100.0%	0		59.65s	1,369	3,985
GPT-4o-mini	3.0	8.7	0.0%	0		2.55s	347	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	10.0	10.0	100.0%	0		304.19s	324	6,088
GPT-4o-mini	3.0	10.0	0.0%	0		7.58s	568	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	6.5	10.0	50.0%	0		37.36s	840	1,937
GPT-4o-mini	10.0	10.0	100.0%	0		1.27s	183	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	3.5	4.4	33.3%	2		64.92s	9,744	15,013
GPT-4o-mini	3.0	10.0	0.0%	0		637ms	15	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	4.1	10.0	0.0%	0		58.26s	150	583
GPT-4o-mini	4.0	10.0	0.0%	0		909ms	66	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	9.8	10.0	100.0%	0		11.78s	266	1,831
GPT-4o-mini	6.3	10.0	50.0%	0		1.27s	69	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	5.9	7.2	55.6%	1		20.73s	697	2,479
GPT-4o-mini	3.5	10.0	0.0%	0		1.30s	308	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	10.0	10.0	100.0%	0		104.44s	234	1,531
GPT-4o-mini	10.0	10.0	100.0%	0		2.51s	205	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	3.0	10.0	0.0%	0		113.91s	4,295	4,416
GPT-4o-mini	3.0	10.0	0.0%	0		794ms	15	0

Comparación rápida

Cambiar par de comparación

Ring-2.6-1TmediumvsQwen3.6 Max Previewnone Claude Sonnet 4.6nonevsRing-2.6-1Tmedium GPT-4o-mininonevsQwen3 Coder Nextmedium MiniMax M2.7mediumvsGPT-4o-mininone DeepSeek V4 FlashhighDisponible gratisvsRing-2.6-1Tmedium Ring-2.6-1TmediumvsGPT-5.3 Chatnone Gemini 3.1 Flash LitelowvsRing-2.6-1Tmedium Gemma 4 31BnoneDisponible gratisvsRing-2.6-1Tmedium DeepSeek V4 ProhighvsRing-2.6-1Tmedium Ring-2.6-1TmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash LiteminimalvsRing-2.6-1Tmedium GPT-4o-mininonevsGLM 4.7 Flashmedium