AI BENCHY
Comparar Gráficos
❤️ Made by XCS
Your ad here

#36

Gemini 2.5 Flash

Google · Lanzamiento: 2025-06-17 · google/gemini-2.5-flash::none

Puntaje prom.

5.34

Costo por resultado

0.107

Consistencia

9.40

Costo total

$0.007

Pruebas correctas

6

Una prueba cuenta como totalmente superada solo si todas sus ejecuciones pasan.

Pruebas incorrectas

8

Tasa de aciertos por intento: 47.6%

Pruebas inestables

1

Tiempo de respuesta: promedio 698ms · total 9.78s · máximo 1.91s

Respuesta incorrecta: 6 No siguió las instrucciones: 2

Mejores modelos por puntuación

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Comparación rápida

Desglose por categoría

Categoría Puntaje prom. Consistencia Pruebas correctas
Anti-AI Tricks 1.00 10.00 0/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 7.21 1/3
Instructions following 8.00 9.99 1/2
Puzzle Solving 4.67 10.00 1/3
Tool Calling 10.00 10.00 1/1