AI BENCHY
Advertise here

#50

GPT-5 Mini

OpenAI Релиз: 2025-08-07 Проверено: 2026-04-11 01:44 openai/gpt-5-mini::medium

Стабильность

8.6

Надежность

Н/Д

Общее число выходных токенов

59,861

Цена входа

$0.250 / 1M

Цена выхода

$2.000 / 1M

Тестов верно

Ошибочных тестов: 9

Доля успешных попыток: 61.1%

Нестабильные тесты

3

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

23.98s

Время ответа (макс.): 88.15s

Время ответа (суммарно): 431.56s

История запусков

Проверено Оценка Надежность Тестов верно Общая стоимость Сравнить
2026-05-22 00:16 Повторный тест 6.9 10.0 $0.150 Сравнить
2026-04-11 01:44 Первый зафиксированный запуск 7.0 Н/Д $0.128 Текущий запуск

Сравнение запусков

ЗапускОценкаСтабильностьНадежностьТестов верноНестабильные тестыОбщее число выходных токеновОбщая стоимостьВремя ответа (среднее)
2026-04-11 01:44 · Первый зафиксированный запуск7.08.6Н/Д9/18359,861$0.12823.98s
2026-05-22 00:16 · Повторный тест6.98.710.010/20370,358$0.15023.99s
Разница+0.1-0.1-10-10497-$0.023-17ms

Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 7.1 7.6
Программирование 10.0 10.0
Комбинированный 10.0 10.0
Парсинг и извлечение данных 10.0 10.0
Предметно-ориентированное 3.6 7.2
Общий интеллект 4.5 10.0
Следование инструкциям 8.0 6.6
Решение головоломок 5.6 9.8
Вызов инструментов 10.0 10.0

Сравниваемые модели