Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5 Mini vs StepFun: Step 3.5 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07 Step 3.5 Flash Step 3.5 Flash medium Релиз: 2026-02-01
Оценка 7.2 7.4
Ранг #73 #61
Надежность 10.0 10.0
Стабильность 9.1 9.1
Тестов верно
Доля успешных попыток 61.7% 61.4%
Нестабильные тесты 2 2
Всего запусков 60 57
Стоимость за результат 1.348 0.133
Общая стоимость $0.149 $0.062
Цена входа $0.250 / 1M $0.090 / 1M
Цена выхода $2.000 / 1M $0.300 / 1M
Выходные токены 6,723 90,478
Токены рассуждений 63,082 173,544
Время ответа (среднее) 23.75s 43.20s
Время ответа (макс.) 88.15s 170.45s
Время ответа (суммарно) 475.03s 561.54s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 1,715 6,378
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 20,391 24,176
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 10.0 10.0 100.0% 0 30.74s 580 12,544
Step 3.5 Flash 2.5 6.0 33.3% 1 62.83s 12,098 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 453 3,200
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 293 14,016
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 349 1,856
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 240 3,506
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 310 3,968
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 2,364 3,521
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 1,622 6,144
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 5,630 10,861
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 160 1,856
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 2,354 10,372

Быстрое сравнение

Сменить пару сравнения