AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs inclusionAI: Ring-2.6-1T

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-22

Métrica	Claude Opus 4.7 Claude Opus 4.7 medium Lanzamiento: 2026-04-16	Ring-2.6-1T Ring-2.6-1T none Lanzamiento: 2026-05-10

Métrica	Claude Opus 4.7 Claude Opus 4.7 medium Lanzamiento: 2026-04-16	Ring-2.6-1T Ring-2.6-1T none Lanzamiento: 2026-05-10
Puntuación	8.9	7.2
Rango	#7	#62
Fiabilidad	10.0	9.8
Consistencia	10.0	9.1
Pruebas correctas
Tasa de aciertos por intento	85.0%	62.5%
Pruebas inestables	0	2
Ejecuciones totales	60	60
Costo por resultado	3.674	0.000
Costo total	$0.625	$0.000
Precio de entrada	$5.000 / 1M	$0.075 / 1M
Precio de salida	$25.000 / 1M	$0.625 / 1M
Tokens de salida	10,468	39,954
Tokens de razonamiento	2,198	0
Tiempo de respuesta (promedio)	4.50s	55.10s
Tiempo de respuesta (máximo)	23.18s	143.82s
Tiempo de respuesta (total)	85.46s	881.55s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	348	0
Ring-2.6-1T	9.2	8.4	91.7%	1		43.33s	5,575	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		14.79s	6,210	1,114
Ring-2.6-1T	10.0	10.0	100.0%	0		143.82s	5,036	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		21.45s	2,369	1,084
Ring-2.6-1T	0.0	0.0	0.0%	0		0ms	0	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	324	0
Ring-2.6-1T	3.0	10.0	0.0%	0		45.87s	1,529	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	51	0
Ring-2.6-1T	5.3	7.2	44.4%	1		73.40s	17,728	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	256	0
Ring-2.6-1T	4.3	10.0	0.0%	0		15.63s	846	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	114	0
Ring-2.6-1T	9.8	10.0	100.0%	0		27.36s	2,004	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		2.51s	399	0
Ring-2.6-1T	7.7	10.0	66.7%	0		31.47s	3,469	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	373	0
Ring-2.6-1T	0.0	0.0	0.0%	0		0ms	0	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	24	0
Ring-2.6-1T	3.0	10.0	0.0%	0		133.60s	3,767	0

Comparación rápida

Cambiar par de comparación

Claude Opus 4.7mediumvsGPT-5.5low Claude Opus 4.7mediumvsGemini 3.5 Flashnone Claude Opus 4.6mediumvsRing-2.6-1Tnone Ring-2.6-1TnonevsGPT-5.4 Nanomedium Ring-2.6-1TnonevsGLM 5V Turbomedium Ring-2.6-1TnonevsQwen3.6 Flashmedium Ring-2.6-1TnonevsGPT-5.4 Minimedium Ring-2.6-1TnonevsStep 3.5 Flashmedium Ring-2.6-1TnonevsGPT-5.2medium Ring-2.6-1TnonevsQwen3.5-Flashmedium DeepSeek V4 FlashhighDisponible gratisvsRing-2.6-1Tnone Ring-2.6-1TnonevsKimi K2.6medium