AI BENCHY
Comparer Graphiques
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#33

GPT-5 Mini

OpenAI · Sortie: 2025-08-07 · openai/gpt-5-mini::medium

Score moy.

5.77

Coût par résultat

1.200

Cohérence

8.80

Coût total

$0.084

Tests corrects

7

Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.

Tests incorrects

7

Taux de réussite par tentative: 57.1%

Tests instables

2

Temps de réponse : moy. 21.47s · total 300.64s · max 82.55s

N'a pas suivi les instructions: 3 Mauvaise réponse: 3 Délai dépassé: 1

Meilleurs modèles par score

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Comparaison rapide

Répartition par catégorie

Catégorie Score moy. Cohérence Tests corrects
Anti-AI Tricks 7.00 9.62 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 7.21 0/3
Instructions following 7.00 6.64 1/2
Puzzle Solving 4.34 9.78 1/3
Tool Calling 10.00 10.00 1/1