AI BENCHY
Comparer Graphiques
❤️ Made by XCS
Your ad here

#30

DeepSeek V3.2

Deepseek · Sortie: 2025-12-01 · deepseek/deepseek-v3.2::none

Score moy.

4.70

Coût par résultat

0.132

Cohérence

8.20

Coût total

$0.007

Tests corrects

5

Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.

Tests incorrects

9

Taux de réussite par tentative: 47.6%

Tests instables

3

Temps de réponse : moy. 6.22s · total 87.03s · max 16.20s

Mauvaise réponse: 6 Mise en forme supplémentaire: 2 N'a pas suivi les instructions: 1

Meilleurs modèles par score

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Comparaison rapide

Répartition par catégorie

Catégorie Score moy. Cohérence Tests corrects
Anti-AI Tricks 1.00 9.68 0/3
Data parsing and extraction 5.38 5.81 1/2
Domain specific 1.00 7.21 0/3
Instructions following 8.00 9.99 1/2
Puzzle Solving 7.67 7.50 2/3
Tool Calling 10.00 10.00 1/1