Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика GPT-5.4 Mini GPT-5.4 Mini none Релиз: 2026-03-17 Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна
Ранг #66 #35
Оценка 4.8 7.0
Стабильность 8.6 7.2
Стоимость за результат 0.737 0.000
Общая стоимость $0.030 $0.000
Тестов верно
Доля успешных попыток 31.4% 68.6%
Нестабильные тесты 3 6
Всего запусков 51 51
Выходные токены 2,085 4,724
Токены рассуждений 0 17,921
Время ответа (среднее) 1.17s 10.33s
Время ответа (макс.) 2.52s 30.53s
Время ответа (суммарно) 19.82s 175.60s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Hunter Alpha 7.3 5.8 83.3% 2 4.75s 479 1,103
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Hunter Alpha 4.7 1.6 66.7% 1 30.53s 792 3,456
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Hunter Alpha 10.0 10.0 100.0% 0 23.16s 1,488 8,017
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Hunter Alpha 3.0 10.0 0.0% 0 10.52s 892 2,406
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Hunter Alpha 7.0 3.7 66.7% 1 6.44s 116 260
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Hunter Alpha 9.9 10.0 100.0% 0 4.18s 208 465
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Hunter Alpha 6.1 4.7 66.7% 2 5.36s 441 1,310
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904

Быстрое сравнение

Сменить пару сравнения