Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика GPT-5.4 Nano GPT-5.4 Nano none Релиз: 2026-03-17 Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна
Ранг #73 #35
Оценка 4.3 7.0
Стабильность 7.3 7.2
Стоимость за результат 0.404 0.000
Общая стоимость $0.009 $0.000
Тестов верно
Доля успешных попыток 29.4% 68.6%
Нестабильные тесты 6 6
Всего запусков 51 51
Выходные токены 2,185 4,724
Токены рассуждений 0 17,921
Время ответа (среднее) 1.39s 10.33s
Время ответа (макс.) 3.84s 30.53s
Время ответа (суммарно) 23.70s 175.60s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Nano 3.5 8.0 16.7% 1 1.18s 800 0
Hunter Alpha 7.3 5.8 83.3% 2 4.75s 479 1,103
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Nano 3.0 10.0 0.0% 0 3.84s 280 0
Hunter Alpha 4.7 1.6 66.7% 1 30.53s 792 3,456
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Nano 6.5 10.0 50.0% 0 1.11s 219 0
Hunter Alpha 10.0 10.0 100.0% 0 23.16s 1,488 8,017
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Nano 2.9 4.4 22.2% 2 926ms 52 0
Hunter Alpha 3.0 10.0 0.0% 0 10.52s 892 2,406
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Nano 3.8 2.5 33.3% 1 1.31s 180 0
Hunter Alpha 7.0 3.7 66.7% 1 6.44s 116 260
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Nano 5.0 6.8 33.3% 1 787ms 84 0
Hunter Alpha 9.9 10.0 100.0% 0 4.18s 208 465
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Nano 3.7 7.3 22.2% 1 1.29s 348 0
Hunter Alpha 6.1 4.7 66.7% 2 5.36s 441 1,310
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Nano 10.0 10.0 100.0% 0 3.40s 222 0
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904

Быстрое сравнение

Сменить пару сравнения