Ranking de modelos de Inteligencia general

Mira qué modelos de IA rinden mejor en Inteligencia general, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

Promedio de Puntuación de Inteligencia general

6.1

Mejor modelo

Qwen3.5-9B 2.8

Motivos de fallo

Con motivo de fallo No siguió las instrucciones78 Con motivo de fallo Respuesta incorrecta62 Con motivo de fallo Error de API12 Con motivo de fallo Tiempo agotado4

216/216

Rango	Modelo	Empresa	Puntuación de Inteligencia general	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#15	Grok 4.5 high	X AI	4.7	8.9	$1.707	0/1	9.82s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $1.707 Tiempo de respuesta (promedio) 9.82s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	5.0	5.6	$0.048	0/1	9.81s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.048 Tiempo de respuesta (promedio) 9.81s
#116	Gemma 4 31B medium	Google	10.0	6.3	$0.107	1/1	9.57s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.107 Tiempo de respuesta (promedio) 9.57s
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	1/1	9.34s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.385 Tiempo de respuesta (promedio) 9.34s
#179	DeepSeek V3.2 none	DeepSeek	4.7	5.0	$0.054	0/1	9.32s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.054 Tiempo de respuesta (promedio) 9.32s
#50	DeepSeek V4 Pro high	DeepSeek	10.0	7.7	$0.200	1/1	8.83s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.200 Tiempo de respuesta (promedio) 8.83s
#94	Qwen3.6 35B A3B medium	Qwen	4.4	6.7	$0.746	0/1	8.66s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.746 Tiempo de respuesta (promedio) 8.66s
#127	gpt-oss-120b medium	OpenAI	4.3	6.1	$0.019	0/1	7.90s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.019 Tiempo de respuesta (promedio) 7.90s
#30	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	1/1	7.73s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $1.694 Tiempo de respuesta (promedio) 7.73s
#20	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	1/1	7.42s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $3.478 Tiempo de respuesta (promedio) 7.42s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	5.1	5.6	$0.077	0/1	7.10s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.077 Tiempo de respuesta (promedio) 7.10s
#71	Step 3.7 Flash low	Stepfun	3.4	7.3	$0.454	0/1	7.00s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.454 Tiempo de respuesta (promedio) 7.00s
#146	Nemotron 3 Super medium	NVIDIA	4.1	5.7	$0.055	0/1	6.91s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.055 Tiempo de respuesta (promedio) 6.91s
#174	MiMo-V2.5 none	Xiaomi	4.4	5.1	$0.025	0/1	6.86s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.025 Tiempo de respuesta (promedio) 6.86s
#33	Step 3.7 Flash medium	Stepfun	4.0	8.0	$0.515	0/1	6.85s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.515 Tiempo de respuesta (promedio) 6.85s

Ranking de Inteligencia general

Filtrar modelos

Mejores modelos por Puntuación de Inteligencia general

Puntuación de Inteligencia general vs costo total

Mejores modelos por Tiempo de respuesta (promedio)