AI BENCHY
Comparer Graphiques
❤️ Made by XCS
Your ad here

#16

Gemini 2.5 Flash

Google · Sortie: 2025-06-17 · google/gemini-2.5-flash::medium

Score moy.

7.06

Coût par résultat

2.762

Cohérence

9.39

Coût total

$0.249

Tests corrects

9

Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.

Tests incorrects

5

Taux de réussite par tentative: 69.1%

Tests instables

1

Temps de réponse : moy. 11.74s · total 164.33s · max 95.48s

Mauvaise réponse: 4 N'a pas suivi les instructions: 1

Meilleurs modèles par score

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Comparaison rapide

Répartition par catégorie

Catégorie Score moy. Cohérence Tests corrects
Anti-AI Tricks 7.34 10.00 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 7.21 1/3
Instructions following 7.00 9.91 1/2
Puzzle Solving 7.00 10.00 2/3
Tool Calling 10.00 10.00 1/1