Anthropic: Claude Opus 4.7 vs Anthropic: Claude Sonnet 4.6

Claude Opus 4.7 (medium) lidera en puntuación media con 8.7 vs 7.8. Claude Opus 4.7 (medium) tiene menor coste de benchmark con $1.477 vs $2.057. Claude Opus 4.7 (medium) es más rápido con 7.61s vs 25.91s, con tasas de acierto de 83.3% vs 66.7%.

Modelo recomendadoClaude Opus 4.7 (medium)Tiene la mejor puntuación aquí (8.7) y responde aproximadamente 3.4x más rápido que Claude Sonnet 4.6 (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-20

Métrica	Claude Opus 4.7 Claude Opus 4.7 medium Lanzamiento: 2026-04-16	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Lanzamiento: 2026-02-17

Métrica	Claude Opus 4.7 Claude Opus 4.7 medium Lanzamiento: 2026-04-16	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Lanzamiento: 2026-02-17
Puntuación	8.7	7.8
Rango	#15	#40
Fiabilidad	10.0	10.0
Consistencia	9.6	9.2
Pruebas correctas
Tasa de aciertos por intento	83.3%	66.7%
Pruebas inestables	1	2
Ejecuciones totales	66	66
Costo por resultado	8.201	14.692
Costo total	$1.477	$2.057
Precio de entrada	$5.000 / 1M	$3.000 / 1M
Precio de salida	$25.000 / 1M	$15.000 / 1M
Total de tokens de entrada	145,252	106,292
Tokens de salida	24,948	80,748
Tokens de razonamiento	5,042	35,117
Tiempo de respuesta (promedio)	7.61s	25.91s
Tiempo de respuesta (máximo)	65.40s	140.96s
Tiempo de respuesta (total)	159.91s	362.78s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#15 Claude Opus 4.7

medium

Coste: $0.059
Tiempo: 26.8s
Tokens: 2,475 tok

#40 Claude Sonnet 4.6

medium

SVG inválido

Coste: $0.000
Tiempo: 300.0s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586

Comparación rápida

Cambiar par de comparación

Claude Sonnet 4.6mediumvsGPT-5.6 Lunahigh Claude Sonnet 4.6mediumvsGPT-5.6 Terrahigh Claude Sonnet 4.6mediumvsKimi K3max Claude Sonnet 4.6mediumvsDeepSeek V4 Flashhigh Claude Sonnet 4.6mediumvsDeepSeek V4 Prohigh Claude Sonnet 4.6mediumvsGLM 5.2high Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6mediumvsInklinghigh Claude Opus 4.7mediumvsGrok 4.5high Claude Opus 4.7mediumvsGemini 3.5 Flashlow Claude Sonnet 4.6mediumvsMuse Spark 1.1high Claude Opus 4.7mediumvsGrok 4.5low