Ranking de modelos de Inteligencia general

Mira qué modelos de IA rinden mejor en Inteligencia general, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Pruebas correctas ↓.

Modelos mostrados

Promedio de Puntuación de Inteligencia general

6.1

Mejor modelo

Gemini 3 Flash Preview 10.0

Motivos de fallo

Con motivo de fallo No siguió las instrucciones78 Con motivo de fallo Respuesta incorrecta59 Con motivo de fallo Error de API12 Con motivo de fallo Tiempo agotado4

210/210

Rango	Modelo	Empresa	Puntuación de Inteligencia general	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	1/1	32.2s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $1.143 Tiempo de respuesta (promedio) 32.2s
#24	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	1/1	4.12s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.647 Tiempo de respuesta (promedio) 4.12s
#27	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	1/1	7.73s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $1.694 Tiempo de respuesta (promedio) 7.73s
#28	Inkling high	Thinkingmachines	10.0	8.0	$1.006	1/1	6.53s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $1.006 Tiempo de respuesta (promedio) 6.53s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.970	1/1	12.9s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.970 Tiempo de respuesta (promedio) 12.9s
#32	Inkling medium	Thinkingmachines	10.0	8.0	$0.391	1/1	4.65s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.391 Tiempo de respuesta (promedio) 4.65s
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	1/1	14.9s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $3.112 Tiempo de respuesta (promedio) 14.9s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	1/1	25.5s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.267 Tiempo de respuesta (promedio) 25.5s
#38	GLM 5.2 medium	Z.ai	10.0	7.8	$0.222	1/1	17.4s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.222 Tiempo de respuesta (promedio) 17.4s
#40	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	1/1	4.94s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $2.057 Tiempo de respuesta (promedio) 4.94s
#41	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	1/1	2.55s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $2.077 Tiempo de respuesta (promedio) 2.55s
#43	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	1/1	5.04s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $3.059 Tiempo de respuesta (promedio) 5.04s
#46	DeepSeek V4 Pro high	DeepSeek	10.0	7.7	$0.200	1/1	8.83s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.200 Tiempo de respuesta (promedio) 8.83s
#52	Kimi K2.7 Code medium	Moonshot AI	10.0	7.5	$0.751	1/1	10.8s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.751 Tiempo de respuesta (promedio) 10.8s
#59	Qwen3.7 Max none	Qwen	10.0	7.4	$0.197	1/1	1.04s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.197 Tiempo de respuesta (promedio) 1.04s

Ranking de Inteligencia general

Filtrar modelos

Mejores modelos por Puntuación de Inteligencia general

Puntuación de Inteligencia general vs costo total

Mejores modelos por Tiempo de respuesta (promedio)