ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.3 Chat

GPT-5.3 Chat lidera en puntuación media con 7.5 vs 7.0. Seed-2.0-Mini (medium) tiene menor coste de benchmark con $0.101 vs $0.571. GPT-5.3 Chat es más rápido con 6.88s vs 92.53s, con tasas de acierto de 57.6% vs 68.2%.

Modelo recomendadoGPT-5.3 ChatTiene la mejor puntuación aquí (7.5) y responde aproximadamente 13.5x más rápido que Seed-2.0-Mini (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-25

Métrica	Seed-2.0-Mini Seed-2.0-Mini medium Lanzamiento: 2026-02-14	GPT-5.3 Chat GPT-5.3 Chat none Lanzamiento: 2026-03-03

Métrica	Seed-2.0-Mini Seed-2.0-Mini medium Lanzamiento: 2026-02-14	GPT-5.3 Chat GPT-5.3 Chat none Lanzamiento: 2026-03-03
Puntuación	7.0	7.5
Rango	#88	#62
Fiabilidad	8.5	10.0
Consistencia	8.9	8.2
Pruebas correctas
Tasa de aciertos por intento	57.6%	68.2%
Pruebas inestables	3	5
Ejecuciones totales	66	66
Costo por resultado	0.917	4.387
Costo total	$0.101	$0.571
Precio de entrada	$0.100 / 1M	$1.750 / 1M
Precio de salida	$0.400 / 1M	$14.000 / 1M
Total de tokens de entrada	125,467	78,990
Tokens de salida	10,778	30,854
Tokens de razonamiento	209,856	0
Tiempo de respuesta (promedio)	92.53s	6.88s
Tiempo de respuesta (máximo)	301.78s	18.33s
Tiempo de respuesta (total)	1665.50s	151.31s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Seed-2.0-Mini

medium

Coste: $0.002
Tiempo: 161.7s
Tokens: 4,379 tok

#62 GPT-5.3 Chat

none

Coste: $0.008
Tiempo: 8.1s
Tokens: 634 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	6.6	10.0	50.0%	0		74.75s	791	360	9,520
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	5.5	9.8	33.3%	0		220.48s	3,823	464	34,964
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	7.3	5.8	83.3%	1		282.30s	100,096	8,627	143,688
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	10.0	10.0	100.0%	0		24.27s	8,568	246	2,743
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	3.0	10.0	0.0%	0		0ms	0	0	0
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	5.1	3.4	33.3%	1		36.65s	585	213	4,210
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	840	69	2,050
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	8.2	7.2	88.9%	1		31.79s	903	527	5,667
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	9,585	222	5,235
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Mini	3.0	10.0	0.0%	0		56.76s	276	50	1,779
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0

Comparación rápida

Cambiar par de comparación

Seed-2.0-MinimediumvsGemini 3.5 Flashnone Kimi K2.7 CodemediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Nemotron 3 UltramediumDisponible gratisvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsDeepSeek V4 Pronone Seed-2.0-MinimediumvsGPT-5.6 Solnone GPT-5.3 ChatnonevsQwen3.5-27Bmedium GPT-5.3 ChatnonevsGrok Build 0.1medium LongCat 2.0mediumvsGPT-5.3 Chatnone MiniMax M3mediumvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsStep 3.7 Flashhigh Seed-2.0-MinimediumvsGPT-5.5none