AI BENCHY
Comparer Graphiques
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#36

Gemini 2.5 Flash

Google · Sortie: 2025-06-17 · google/gemini-2.5-flash::none

Score moy.

5.34

Coût par résultat

0.107

Cohérence

9.40

Coût total

$0.007

Tests corrects

6

Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.

Tests incorrects

8

Taux de réussite par tentative: 47.6%

Tests instables

1

Temps de réponse : moy. 698ms · total 9.78s · max 1.91s

Mauvaise réponse: 6 N'a pas suivi les instructions: 2

Meilleurs modèles par score

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Comparaison rapide

Répartition par catégorie

Catégorie Score moy. Cohérence Tests corrects
Anti-AI Tricks 1.00 10.00 0/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 7.21 1/3
Instructions following 8.00 9.99 1/2
Puzzle Solving 4.67 10.00 1/3
Tool Calling 10.00 10.00 1/1