#13
Stepfun · Sortie: 2026-02-01 · stepfun/step-3.5-flash::medium
Tests instables
2
Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).
N'a pas suivi les instructions: 3 Mauvaise réponse: 3
Graphiques
Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.
Comparaison rapide
Step 3.5 FlashmediumDisponible gratuitementvsGemini 3.1 Flash Lite PreviewmediumStep 3.5 FlashmediumDisponible gratuitementvsGLM 5mediumStep 3.5 FlashmediumDisponible gratuitementvsClaude Sonnet 4.6mediumStep 3.5 FlashmediumDisponible gratuitementvsGPT-5.2 ChatnoneStep 3.5 FlashmediumDisponible gratuitementvsQwen3.5-122B-A10BmediumStep 3.5 FlashmediumDisponible gratuitementvsGemini 2.5 FlashmediumStep 3.5 FlashmediumDisponible gratuitementvsGemini 3 Flash PreviewmediumStep 3.5 FlashmediumDisponible gratuitementvsGemini 3.1 Pro PreviewmediumStep 3.5 FlashmediumDisponible gratuitementvsTrinity Large PreviewnoneDisponible gratuitement
Répartition par catégorie
| Catégorie | Score moy. | Cohérence | Tests corrects |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 10.0 | 10.0 | |
| Domain specific | 4.0 | 7.2 | |
| General Intelligence | 6.0 | 10.0 | |
| Instructions following | 9.0 | 6.8 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |