Comparar Gráficos Metodología

Idioma:

❤️ Made by XCS

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.4

Comparar:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-06

Métrica	ByteDance Seed: Seed-2.0-Mini medium Lanzamiento: 2026-02-14	OpenAI: GPT-5.4 none Lanzamiento: 2026-03-05
Puntaje prom.	7.0	4.6
Rango	#24	#45
Pruebas correctas
Consistencia	9.4	8.9
Costo por resultado	0.261	1.496
Costo total	$0.027	$0.090
Tasa de aciertos por intento	71.1%	44.4%
Pruebas inestables	1	2
common.totalRuns	45 (15 x 3)	45 (15 x 3)
Tokens de salida	1,752	1,635
Tokens de razonamiento	54,246	0
Tiempo de respuesta (promedio)	67.46s	1.46s
Tiempo de respuesta (máximo)	262.83s	2.89s
Tiempo de respuesta (total)	809.49s	21.86s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntaje prom. vs Tiempo de respuesta (promedio)

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
ByteDance Seed: Seed-2.0-Mini	7.0	10.0	66.7%	0		98.99s	354	9,352
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	404	29,806
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
ByteDance Seed: Seed-2.0-Mini	9.9	10.0	100.0%	0		24.27s	246	2,743
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	0.0%	0		0ms	0	0
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	69	2,050
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
ByteDance Seed: Seed-2.0-Mini	7.0	7.2	88.9%	1		25.85s	457	5,060
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	222	5,235
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

Comparación rápida

Cambiar par de comparación

Seed-2.0-MinimediumvsGemini 3 Flash Previewnone Claude Sonnet 4.6nonevsSeed-2.0-Minimedium MiniMax M2.5mediumvsGPT-5.4none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsQwen3.5 Plus 2026-02-15none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-MinimediumvsGPT-5.2 Chatnone Mercury 2mediumvsGPT-5.4none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewhigh Seed-2.0-MinimediumvsGemini 3 Flash Previewlow Seed-2.0-MinimediumvsGLM 5none