Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Google: Gemma 4 31B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-24

Метрика DeepSeek V4 Flash DeepSeek V4 Flash high Релиз: 2026-04-24 Gemma 4 31B Gemma 4 31B medium Релиз: 2026-04-02 Бесплатно доступно
Оценка 7.8 8.3
Ранг #37 #16
Надежность Н/Д Н/Д
Стабильность 7.8 9.2
Тестов верно
Доля успешных попыток 79.6% 79.6%
Нестабильные тесты 5 2
Всего запусков 52 54
Стоимость за результат 0.189 0.136
Общая стоимость $0.021 $0.018
???? ????? $0.140 / 1M $0.130 / 1M
???? ?????? $0.280 / 1M $0.380 / 1M
Выходные токены 1,757 12,734
Токены рассуждений 55,907 27,950
Время ответа (среднее) 47.47s 24.88s
Время ответа (макс.) 255.28s 70.97s
Время ответа (суммарно) 854.45s 398.13s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
Gemma 4 31B 4.7 1.6 66.7% 1 70.97s 3,166 5,449
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.1 4.4 44.5% 2 112.69s 19 24,857
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0

Быстрое сравнение

Сменить пару сравнения