#13
Stepfun · Релиз: 2026-02-01 · stepfun/step-3.5-flash::medium
Нестабильные тесты
2
Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).
Не соблюдены инструкции: 3 Неверный ответ: 3
Графики
Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.
Быстрое сравнение
Step 3.5 FlashmediumБесплатно доступноvsGemini 3.1 Flash Lite PreviewmediumStep 3.5 FlashmediumБесплатно доступноvsGLM 5mediumStep 3.5 FlashmediumБесплатно доступноvsClaude Sonnet 4.6mediumStep 3.5 FlashmediumБесплатно доступноvsGPT-5.2 ChatnoneStep 3.5 FlashmediumБесплатно доступноvsQwen3.5-122B-A10BmediumStep 3.5 FlashmediumБесплатно доступноvsGemini 2.5 FlashmediumStep 3.5 FlashmediumБесплатно доступноvsGemini 3 Flash PreviewmediumStep 3.5 FlashmediumБесплатно доступноvsGemini 3.1 Pro PreviewmediumStep 3.5 FlashmediumБесплатно доступноvsTrinity Large PreviewnoneБесплатно доступно
Разбивка по категориям
| Категория | Средний балл | Стабильность | Тестов верно |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 10.0 | 10.0 | |
| Domain specific | 4.0 | 7.2 | |
| General Intelligence | 6.0 | 10.0 | |
| Instructions following | 9.0 | 6.8 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |