AI BENCHY
Comparar Gráficos
❤️ XCS
Your ad here

#39

LiquidAI: LFM2-24B-A2B

Liquid · liquid/lfm-2-24b-a2b::none

Abrir selector de comparación de modelos

Puntaje prom.

2.43

Costo por resultado

0.045

Consistencia

8.91

Costo total

$0.001

Pruebas correctas

1/14

Una prueba cuenta como totalmente superada solo si todas sus ejecuciones pasan.

Pruebas incorrectas

13

Tasa de aciertos por intento: 16.7%

Pruebas inestables

2

Tiempo de respuesta: promedio 851ms · total 11.07s · máximo 2.88s

Respuesta incorrecta: 8 Error de API: 3 No siguió las instrucciones: 2

Mejores modelos por puntuación

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Desglose por categoría

Categoría Puntaje prom. Consistencia Pruebas correctas
Anti-AI Tricks 1.00 9.82 0/3
Data parsing and extraction 1.00 10.00 0/2
Domain specific 4.00 7.21 1/3
Instructions following 3.00 10.00 0/2
Puzzle Solving 3.34 7.89 0/3
Tool Calling 1.00 10.00 0/1