5.9
Стабильность
9.1
Н/Д
Общее число выходных токенов
2,317
Общее число входных токенов
0
Цена входа
$2.500 / 1M
Цена выхода
$15.000 / 1M
Нестабильные тесты
2
Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).
История запусков
| Проверено | Оценка | Надежность | Тестов верно | Общая стоимость | Сравнить |
|---|---|---|---|---|---|
| 2026-05-22 00:18 Набор изменён | 5.6 | 10.0 | $0.115 | Сравнить | |
| 2026-04-11 01:44 Первый зафиксированный запуск | 5.9 | Н/Д | $0.104 | Текущий запуск |
Сравнение запусков
| Запуск | Оценка | Стабильность | Надежность | Тестов верно | Нестабильные тесты | Общее число выходных токенов | Общее число входных токенов | Общая стоимость | Время ответа (среднее) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · Первый зафиксированный запуск | 5.9 | 9.1 | Н/Д | 7/18 | 2 | 2,317 | 0 | $0.104 | 1.51s |
| 2026-05-22 00:18 · Набор изменён | 5.6 | 9.1 | 10.0 | 7/20 | 2 | 2,378 | 0 | $0.115 | 1.46s |
| Разница | +0.3 | 0.0 | 0 | 0 | -61 | 0 | -$0.012 | +50ms |
Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.
Графики
Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.
Оценка vs Общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Быстрое сравнение
GPT-5.4nonevsgpt-oss-120bmediumБесплатно доступноGPT-5.4nonevsGLM 5V TurbononeGPT-5.4nonevsNemotron 3 SupermediumБесплатно доступноGPT-5.4nonevsSeed-2.0-LitenoneGPT-5.4nonevsOwl AlphamediumGPT-5.4nonevsGemini 3 Flash PreviewmediumGPT-5.4nonevsGemini 3.5 FlashhighGPT-5.4nonevsRing-2.6-1TmediumGPT-5.4nonevsGemini 3.5 Flashlow
Разбивка по категориям
| Категория | Оценка | Стабильность | Тестов верно |
|---|---|---|---|
| Анти-ИИ уловки | 3.2 | 8.0 | |
| Программирование | 10.0 | 10.0 | |
| Комбинированный | 3.0 | 10.0 | |
| Парсинг и извлечение данных | 10.0 | 10.0 | |
| Предметно-ориентированное | 5.3 | 7.2 | |
| Общий интеллект | 4.4 | 9.9 | |
| Следование инструкциям | 6.5 | 10.0 | |
| Решение головоломок | 5.6 | 9.8 | |
| Вызов инструментов | 10.0 | 10.0 |