Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-15

Метрика Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03 Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна
Ранг #21 #32
Оценка 7.9 7.1
Стабильность 10.0 7.6
Стоимость за результат 0.177 0.000
Общая стоимость $0.020 $0.000
Тестов верно
Доля успешных попыток 68.8% 68.8%
Нестабильные тесты 0 5
Всего запусков 48 48
Выходные токены 1,611 4,686
Токены рассуждений 7,272 17,821
Время ответа (среднее) 3.36s 10.71s
Время ответа (макс.) 11.91s 30.53s
Время ответа (суммарно) 53.84s 171.41s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 2.18s 456 1,224
Hunter Alpha 8.2 7.2 88.9% 1 4.93s 441 1,003
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
Hunter Alpha 4.7 1.6 66.7% 1 30.53s 792 3,456
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
Hunter Alpha 10.0 10.0 100.0% 0 23.16s 1,488 8,017
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Hunter Alpha 3.0 10.0 0.0% 0 10.52s 892 2,406
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
Hunter Alpha 7.0 3.7 66.7% 1 6.44s 116 260
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Hunter Alpha 9.9 10.0 100.0% 0 4.18s 208 465
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Hunter Alpha 6.1 4.7 66.7% 2 5.36s 441 1,310
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904

Быстрое сравнение

Сменить пару сравнения