#13
Stepfun ยท Releasedatum: 2026-02-01 ยท stepfun/step-3.5-flash::medium
Instabiele tests
2
Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).
Instructies niet gevolgd: 3 Verkeerd antwoord: 3
Grafieken
Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.
Snelle vergelijking
Step 3.5 FlashmediumGratis beschikbaarvsGemini 3.1 Flash Lite PreviewmediumStep 3.5 FlashmediumGratis beschikbaarvsGLM 5mediumStep 3.5 FlashmediumGratis beschikbaarvsClaude Sonnet 4.6mediumStep 3.5 FlashmediumGratis beschikbaarvsGPT-5.2 ChatnoneStep 3.5 FlashmediumGratis beschikbaarvsQwen3.5-122B-A10BmediumStep 3.5 FlashmediumGratis beschikbaarvsGemini 2.5 FlashmediumStep 3.5 FlashmediumGratis beschikbaarvsGemini 3 Flash PreviewmediumStep 3.5 FlashmediumGratis beschikbaarvsGemini 3.1 Pro PreviewmediumStep 3.5 FlashmediumGratis beschikbaarvsTrinity Large PreviewnoneGratis beschikbaar
Categorie-uitsplitsing
| Categorie | Gem. score | Consistentie | Correcte tests |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 10.0 | 10.0 | |
| Domain specific | 4.0 | 7.2 | |
| General Intelligence | 6.0 | 10.0 | |
| Instructions following | 9.0 | 6.8 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |