AI BENCHY Compare

Elephant Alpha vs Qwen: Qwen3 Coder Next

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-03

Métrica	Elephant Alpha Elephant Alpha medium Lanzamiento: 2026-04-14	Qwen3 Coder Next Qwen3 Coder Next none Lanzamiento: 2026-02-03

Métrica	Elephant Alpha Elephant Alpha medium Lanzamiento: 2026-04-14	Qwen3 Coder Next Qwen3 Coder Next none Lanzamiento: 2026-02-03
Puntuación	5.3	5.1
Rango	#134	#138
Fiabilidad	N/D	10.0
Consistencia	9.7	9.7
Pruebas correctas
Tasa de aciertos por intento	31.7%	28.3%
Pruebas inestables	1	1
Ejecuciones totales	60	60
Costo por resultado	0.000	0.159
Costo total	$0.000	$0.008
Precio de entrada	$0.000 / 1M	$0.110 / 1M
Precio de salida	$0.000 / 1M	$0.800 / 1M
Total de tokens de entrada	33,744	44,864
Tokens de salida	2,596	3,575
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	1.27s	9.05s
Tiempo de respuesta (máximo)	3.70s	45.14s
Tiempo de respuesta (total)	22.82s	126.72s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	726	815	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	645	1,321	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	4.0	6.7	16.7%	1		1.30s	813	365	0
Qwen3 Coder Next	5.4	6.9	33.3%	1		2.01s	4,799	612	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	14,046	562	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	20,469	317	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	6.5	10.0	50.0%	0		979ms	8,004	246	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	7,758	246	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	3.0	10.0	0.0%	0		925ms	810	24	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	753	26	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	4.3	10.0	0.0%	0		920ms	540	105	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	498	152	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	9.8	10.0	100.0%	0		987ms	732	82	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.78s	684	63	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	5.3	10.0	33.3%	0		868ms	729	166	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		24.34s	678	571	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	7,344	231	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	8,364	255	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Elephant Alpha	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	216	12	0

Comparación rápida

Cambiar par de comparación

Kimi K2.5nonevsElephant Alphamedium Elephant AlphamediumvsGLM 5 Turbonone Ling-2.6-flashnonevsElephant Alphamedium Elephant AlphamediumvsQwen3.5-122B-A10Bnone DeepSeek V3.2nonevsElephant Alphamedium Elephant AlphamediumvsGrok 4.20none gpt-oss-120bnoneDisponible gratisvsElephant Alphamedium DeepSeek V4 FlashnonevsElephant Alphamedium Elephant AlphamediumvsQwen3.6 Flashnone Nemotron 3 SupernoneDisponible gratisvsElephant Alphamedium Mistral Small 4nonevsElephant Alphamedium Kimi K2.6noneDisponible gratisvsElephant Alphamedium