Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-26

Метрика Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19 Hunter Alpha Hunter Alpha medium Релиз: 2026-03-11
Оценка 9.6 6.7
Ранг #2 #60
Надежность Н/Д Н/Д
Стабильность 10.0 7.4
Тестов верно
Доля успешных попыток 94.4% 64.8%
Нестабильные тесты 0 6
Всего запусков 54 52
Стоимость за результат 3.400 0.000
Общая стоимость $0.578 $0.000
???? ????? $2.000 / 1M $0.000 / 1M
???? ?????? $12.000 / 1M $0.000 / 1M
Выходные токены 1,932 4,724
Токены рассуждений 40,542 17,921
Время ответа (среднее) 15.96s 10.33s
Время ответа (макс.) 40.61s 30.53s
Время ответа (суммарно) 175.52s 175.60s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Hunter Alpha 7.3 5.8 83.3% 2 4.75s 479 1,103
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Hunter Alpha 3.0 10.0 0.0% 0 0ms 0 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Hunter Alpha 4.7 1.6 66.7% 1 30.53s 792 3,456
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Hunter Alpha 10.0 10.0 100.0% 0 23.16s 1,488 8,017
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Hunter Alpha 3.0 10.0 0.0% 0 10.52s 892 2,406
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Hunter Alpha 7.0 3.7 66.7% 1 6.44s 116 260
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Hunter Alpha 9.9 10.0 100.0% 0 4.18s 208 465
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Hunter Alpha 6.1 4.7 66.7% 2 5.36s 441 1,310
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904

Быстрое сравнение

Сменить пару сравнения