AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs ByteDance Seed: Seed-2.0-Lite

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-29

Métrica	Claude Sonnet 4.6 Claude Sonnet 4.6 none Lanzamiento: 2026-02-17	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14

Métrica	Claude Sonnet 4.6 Claude Sonnet 4.6 none Lanzamiento: 2026-02-17	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14
Puntuación	7.4	8.6
Rango	#54	#10
Fiabilidad	N/D	N/D
Consistencia	9.6	8.8
Pruebas correctas
Tasa de aciertos por intento	64.8%	83.3%
Pruebas inestables	1	3
Ejecuciones totales	54	54
Costo por resultado	2.376	0.926
Costo total	$0.262	$0.121
Precio de entrada	$3.000 / 1M	$0.250 / 1M
Precio de salida	$15.000 / 1M	$2.000 / 1M
Tokens de salida	7,433	3,257
Tokens de razonamiento	0	52,042
Tiempo de respuesta (promedio)	4.98s	30.37s
Tiempo de respuesta (máximo)	23.84s	168.71s
Tiempo de respuesta (total)	54.83s	546.72s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	4.8	10.0	25.0%	0		2.94s	1,214	0
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.67s	523	0
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	9.5	10.0	100.0%	0		23.84s	3,766	0
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.43s	252	0
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	7.7	10.0	66.7%	0		3.54s	413	0
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	6.1	3.1	66.7%	1		2.56s	192	0
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	6.5	10.0	50.0%	0		1.96s	90	0
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	7.7	10.0	66.7%	0		2.92s	536	0
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.11s	447	0
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011

Comparación rápida

Cambiar par de comparación

Claude Sonnet 4.6nonevsQwen3.5-35B-A3Bmedium Claude Sonnet 4.6nonevsMiMo-V2-Flashmedium Claude Sonnet 4.6nonevsGPT-5.2medium Seed-2.0-LitemediumvsHY3 PreviewhighDisponible gratis Claude Sonnet 4.6nonevsSeed-2.0-Minimedium Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium Claude Sonnet 4.6nonevsGPT-5.4 Minimedium Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Claude Sonnet 4.6nonevsMiMo-V2-Omnimedium Claude Sonnet 4.6nonevsKimi K2.6medium Claude Sonnet 4.6nonevsMiMo-V2.5medium Claude Sonnet 4.6nonevsGLM 5.1medium