Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Google: Gemma 4 31B

Сводка

Сравнение benchmark Gemini 2.5 Flash vs Gemma 4 31B: Gemini 2.5 Flash лидирует по среднему баллу: 8.2 vs 6.3. Gemma 4 31B имеет более низкую стоимость benchmark: $0.033 vs $0.379. Gemini 2.5 Flash быстрее: 15.49s vs 56.55s, с долей успешных попыток 69.8% vs 69.8%.

Рекомендуемая модель: Gemini 2.5 Flash - Здесь у него лучший балл (8.2), и он отвечает примерно в 3.6 раза быстрее, чем Gemma 4 31B.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика Gemini 2.5 Flash Gemini 2.5 Flash medium Релиз: 2025-06-17 Gemma 4 31B Gemma 4 31B medium Релиз: 2026-04-02 Бесплатно доступно
Оценка 8.2 6.3
Ранг #24 #88
Надежность 10.0 10.0
Стабильность 9.6 9.4
Тестов верно
Доля успешных попыток 69.8% 69.8%
Нестабильные тесты 1 1
Всего запусков 63 63
Стоимость за результат 2.701 0.257
Общая стоимость $0.379 $0.033
Цена входа $0.300 / 1M $0.120 / 1M
Цена выхода $2.500 / 1M $0.350 / 1M
Общее число входных токенов 34,476 17,957
Выходные токены 1,930 22,356
Токены рассуждений 145,145 65,726
Время ответа (среднее) 15.49s 56.55s
Время ответа (макс.) 95.48s 437.40s
Время ответа (суммарно) 325.39s 1074.41s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#24 Gemini 2.5 Flash

medium
Неверный SVG
Стоимость
$0.000
Время
274.0s
Токены
0 tok

#88 Gemma 4 31B

medium
Стоимость
$0.002
Время
45.7s
Токены
2,696 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 492 255 10,233
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 7.8 10.0 66.7% 0 41.01s 6,669 543 32,303
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 12,522 303 11,922
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 7,257 279 2,325
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 633 18 80,702
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 486 92 1,899
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 615 69 1,203
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 558 126 2,499
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 5,088 234 1,140
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 156 11 919
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014

Быстрое сравнение

Сменить пару сравнения