AI BENCHY
Comparer Graphiques
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#12

DeepSeek V3.2

Deepseek · Sortie: 2025-12-01 · deepseek/deepseek-v3.2::medium

Score moy.

6.99

Coût par résultat

0.193

Cohérence

8.75

Coût total

$0.018

Tests corrects

9

Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.

Tests incorrects

5

Taux de réussite par tentative: 71.4%

Tests instables

2

Temps de réponse : moy. 36.24s · total 507.30s · max 79.03s

Mauvaise réponse: 3 N'a pas suivi les instructions: 1 Délai dépassé: 1

Meilleurs modèles par score

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Comparaison rapide

Répartition par catégorie

Catégorie Score moy. Cohérence Tests corrects
Anti-AI Tricks 7.00 9.86 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 7.21 1/3
Instructions following 7.00 9.84 1/2
Puzzle Solving 7.00 7.21 2/3
Tool Calling 10.00 10.00 1/1