AI BENCHY
Сравнить Графики Методология
❤️ Made by XCS
Your ad here

#13

Step 3.5 Flash

Stepfun · Релиз: 2026-02-01 · stepfun/step-3.5-flash::medium

Стоимость за результат

0.000

Стабильность

9.1

Тестов верно

Ошибочных тестов: 6

Доля успешных попыток: 68.8%

Нестабильные тесты

2

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

29.10s

Время ответа (макс.): 170.45s

Время ответа (суммарно): 290.96s

Не соблюдены инструкции: 3 Неверный ответ: 3

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Быстрое сравнение

Разбивка по категориям

Категория Средний балл Стабильность Тестов верно
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 10.0 10.0
Domain specific 4.0 7.2
General Intelligence 6.0 10.0
Instructions following 9.0 6.8
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0