AI BENCHY
Advertise here

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

12

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Qwen3.6 27B 7.7
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#137 Elephant Alpha none Openrouter 4.2 5.1 0/3 807ms
#102 Gemma 4 26B A4B none Google 6.2 6.0 1/3 744ms
#90 Gemini 3.1 Flash Lite none Google 6.3 6.4 1/3 720ms
#146 Laguna Xs.2 none Poolside 5.3 4.8 1/3 650ms
#154 Qwen3.5-9B none Qwen 3.2 4.6 0/3 621ms
#163 Granite 4.1 8B none IBM Granite 3.2 4.0 0/3 608ms
#97 Gemini 2.5 Flash none Google 7.7 6.2 2/3 604ms
#106 Grok 4.20 Beta none X AI 7.7 5.8 2/3 586ms
#155 Mercury 2 none Inception 3.1 4.5 0/3 535ms
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 3.0 4.1 0/3 532ms
#127 Grok 4.20 none X AI 5.3 5.4 1/3 473ms
#142 Mistral Small 4 none Mistral 3.1 4.9 0/3 399ms

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)