Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs IBM: Granite 4.1 8B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика DeepSeek V4 Flash DeepSeek V4 Flash none Релиз: 2026-04-24 Бесплатно доступно Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01
Оценка 5.1 4.1
Ранг #137 #158
Надежность 10.0 10.0
Стабильность 8.8 10.0
Тестов верно
Доля успешных попыток 31.7% 10.0%
Нестабильные тесты 3 0
Всего запусков 60 60
Стоимость за результат 0.198 0.122
Общая стоимость $0.010 $0.003
Цена входа $0.100 / 1M $0.050 / 1M
Цена выхода $0.200 / 1M $0.100 / 1M
Выходные токены 13,700 2,743
Токены рассуждений 0 0
Время ответа (среднее) 27.97s 719ms
Время ответа (макс.) 111.96s 2.17s
Время ответа (суммарно) 559.36s 14.37s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 174 0
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.8 6.0 16.7% 1 24.47s 9,707 0
Granite 4.1 8B 5.2 10.0 0.0% 0 706ms 357 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 2,664 0
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 195 0
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 18 0
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 67 0
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 321 0
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.1 7.3 11.1% 1 23.72s 207 0
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 432 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 327 0
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 20 0
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 12 0

Быстрое сравнение

Сменить пару сравнения