AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
Your ad here

#13

Step 3.5 Flash

Stepfun · Sortie: 2026-02-01 · stepfun/step-3.5-flash::medium

Coût par résultat

0.000

Cohérence

9.1

Coût total

$0.000

Tests corrects

Tests incorrects: 6

Taux de réussite par tentative: 68.8%

Tests instables

2

Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).

Temps de réponse (moy.)

29.10s

Temps de réponse (max): 170.45s

Temps de réponse (total): 290.96s

N'a pas suivi les instructions: 3 Mauvaise réponse: 3

Graphiques

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Comparaison rapide

Répartition par catégorie

Catégorie Score moy. Cohérence Tests corrects
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 10.0 10.0
Domain specific 4.0 7.2
General Intelligence 6.0 10.0
Instructions following 9.0 6.8
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0