Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs IBM: Granite 4.1 8B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика Gemini 3 Flash Preview Gemini 3 Flash Preview medium Релиз: 2025-12-17 Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01
Оценка 10.0 4.3
Ранг #1 #135
Надежность Н/Д 10.0
Стабильность 10.0 10.0
Тестов верно
Доля успешных попыток 100.0% 11.1%
Нестабильные тесты 0 0
Всего запусков 18 54
Стоимость за результат 0.600 0.110
Общая стоимость $0.108 $0.003
???? ????? $0.500 / 1M $0.050 / 1M
???? ?????? $3.000 / 1M $0.100 / 1M
Выходные токены 655 2,712
Токены рассуждений 33,749 0
Время ответа (среднее) 12.11s 767ms
Время ответа (макс.) 82.37s 2.17s
Время ответа (суммарно) 217.93s 13.81s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
Granite 4.1 8B 6.9 10.0 0.0% 0 1.07s 339 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
Granite 4.1 8B 3.7 10.0 0.0% 0 635ms 431 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0

Быстрое сравнение

Сменить пару сравнения