Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика GPT-5.4 Mini GPT-5.4 Mini medium Релиз: 2026-03-17 Hunter Alpha Hunter Alpha none Релиз: Дата релиза неизвестна
Ранг #34 #51
Оценка 7.1 5.9
Стабильность 7.2 8.1
Стоимость за результат 3.610 0.000
Общая стоимость $0.289 $0.000
Тестов верно
Доля успешных попыток 68.6% 49.0%
Нестабильные тесты 6 4
Всего запусков 51 51
Выходные токены 1,708 2,278
Токены рассуждений 58,019 0
Время ответа (среднее) 15.66s 4.58s
Время ответа (макс.) 102.91s 15.17s
Время ответа (суммарно) 266.14s 77.92s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Hunter Alpha 3.5 8.0 16.7% 1 3.81s 779 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Hunter Alpha 3.0 10.0 0.0% 0 15.17s 379 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Hunter Alpha 10.0 10.0 100.0% 0 8.49s 249 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Hunter Alpha 5.3 10.0 33.3% 0 2.33s 27 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Hunter Alpha 6.1 3.1 66.7% 1 2.71s 91 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Hunter Alpha 6.4 10.0 50.0% 0 2.82s 69 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
Hunter Alpha 5.8 4.4 66.7% 2 3.06s 349 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Hunter Alpha 10.0 10.0 100.0% 0 6.02s 335 0

Быстрое сравнение

Сменить пару сравнения