Anthropic: Claude Sonnet 4.6 vs ByteDance Seed: Seed-2.0-Mini

Claude Sonnet 4.6 lidera en puntuación media con 7.3 vs 7.0. Seed-2.0-Mini (medium) tiene menor coste de benchmark con $0.101 vs $0.661. Claude Sonnet 4.6 es más rápido con 8.12s vs 92.53s, con tasas de acierto de 57.6% vs 57.6%.

Modelo recomendadoClaude Sonnet 4.6Tiene la mejor puntuación aquí (7.3) y responde aproximadamente 11.4x más rápido que Seed-2.0-Mini (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-17

Métrica	Claude Sonnet 4.6 Claude Sonnet 4.6 none Lanzamiento: 2026-02-17	Seed-2.0-Mini Seed-2.0-Mini medium Lanzamiento: 2026-02-14

Métrica	Claude Sonnet 4.6 Claude Sonnet 4.6 none Lanzamiento: 2026-02-17	Seed-2.0-Mini Seed-2.0-Mini medium Lanzamiento: 2026-02-14
Puntuación	7.3	7.0
Rango	#60	#77
Fiabilidad	10.0	8.5
Consistencia	9.7	8.9
Pruebas correctas
Tasa de aciertos por intento	57.6%	57.6%
Pruebas inestables	1	3
Ejecuciones totales	66	66
Costo por resultado	5.502	0.917
Costo total	$0.661	$0.101
Precio de entrada	$3.000 / 1M	$0.100 / 1M
Precio de salida	$15.000 / 1M	$0.400 / 1M
Total de tokens de entrada	123,264	125,467
Tokens de salida	19,362	10,778
Tokens de razonamiento	0	209,856
Tiempo de respuesta (promedio)	8.12s	92.53s
Tiempo de respuesta (máximo)	51.18s	301.78s
Tiempo de respuesta (total)	121.78s	1665.50s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#60 Claude Sonnet 4.6

none

Coste: $0.038
Tiempo: 27.3s
Tokens: 2,598 tok

#77 Seed-2.0-Mini

medium

Coste: $0.002
Tiempo: 161.7s
Tokens: 4,379 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	4.8	10.0	25.0%	0		2.94s	636	1,214	0
Seed-2.0-Mini	6.6	10.0	50.0%	0		74.75s	791	360	9,520

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	5.5	10.0	33.3%	0		5.19s	8,522	2,127	0
Seed-2.0-Mini	5.5	9.8	33.3%	0		220.48s	3,823	464	34,964

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	9.8	10.0	100.0%	0		37.51s	91,402	13,663	0
Seed-2.0-Mini	7.3	5.8	83.3%	1		282.30s	100,096	8,627	143,688

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.43s	8,574	252	0
Seed-2.0-Mini	10.0	10.0	100.0%	0		24.27s	8,568	246	2,743

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	7.7	10.0	66.7%	0		3.54s	759	413	0
Seed-2.0-Mini	3.0	10.0	0.0%	0		0ms	0	0	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	6.1	3.1	66.7%	1		2.56s	513	192	0
Seed-2.0-Mini	5.1	3.4	33.3%	1		36.65s	585	213	4,210

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	6.5	10.0	50.0%	0		1.96s	690	90	0
Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	840	69	2,050

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	7.7	10.0	66.7%	0		2.53s	663	533	0
Seed-2.0-Mini	8.2	7.2	88.9%	1		31.79s	903	527	5,667

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.11s	11,301	447	0
Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	9,585	222	5,235

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	3.0	10.0	0.0%	0		4.67s	204	431	0
Seed-2.0-Mini	3.0	10.0	0.0%	0		56.76s	276	50	1,779

Comparación rápida

Cambiar par de comparación

Seed-2.0-MinimediumvsGemini 3.5 Flashnone Claude Sonnet 4.6nonevsKAT-Coder-Pro V2.5low Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium Claude Sonnet 4.6nonevsGemini 3 Flash Previewlow Claude Sonnet 4.6nonevsGemini 3.1 Flash Litemedium Seed-2.0-MinimediumvsDeepSeek V4 Pronone Seed-2.0-MinimediumvsGPT-5.6 Solnone Claude Sonnet 4.6nonevsStep 3.7 Flashlow Claude Sonnet 4.6nonevsQwen3.5-27Bmedium Seed-2.0-MinimediumvsStep 3.7 Flashhigh Claude Sonnet 4.6nonevsKimi K2.6medium Seed-2.0-MinimediumvsGPT-5.5none