AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemma 4 31B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemma 4 31B Gemma 4 31B medium Релиз: 2026-04-02 Бесплатно доступно

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemma 4 31B Gemma 4 31B medium Релиз: 2026-04-02 Бесплатно доступно
Оценка	8.3	8.2
Ранг	#11	#14
Надежность	10.0	6.7
Стабильность	8.9	9.6
Тестов верно
Доля успешных попыток	79.0%	77.2%
Нестабильные тесты	3	1
Всего запусков	57	57
Стоимость за результат	0.958	0.158
Общая стоимость	$0.125	$0.023
???? ?????	$0.250 / 1M	$0.130 / 1M
???? ??????	$2.000 / 1M	$0.380 / 1M
Выходные токены	3,266	14,426
Токены рассуждений	54,082	37,964
Время ответа (среднее)	31.32s	28.72s
Время ответа (макс.)	168.71s	90.14s
Время ответа (суммарно)	595.04s	488.27s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
Gemma 4 31B	10.0	10.0	100.0%	0		12.89s	962	2,046

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
Gemma 4 31B	4.7	1.6	66.7%	1		70.97s	3,166	5,449

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
Gemma 4 31B	10.0	10.0	100.0%	0		21.11s	1,822	2,951

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
Gemma 4 31B	7.7	10.0	66.7%	0		38.48s	4,349	8,985

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
Gemma 4 31B	10.0	10.0	100.0%	0		9.57s	105	888

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
Gemma 4 31B	10.0	10.0	100.0%	0		12.76s	533	2,035

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
Gemma 4 31B	9.9	10.0	100.0%	0		27.63s	1,797	5,596

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	9	2,040
Gemma 4 31B	3.0	10.0	0.0%	0		90.14s	1,692	10,014

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Seed-2.0-LitemediumvsGPT-5.5low Gemma 4 31BmediumБесплатно доступноvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewnone Gemma 4 31BmediumБесплатно доступноvsGPT-5.5low Gemma 4 31BmediumБесплатно доступноvsGPT-5.3 Chatnone Seed-2.0-LitemediumvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGemma 4 31BmediumБесплатно доступно Seed-2.0-LitemediumvsGemini 3.1 Flash Litelow Seed-2.0-LitemediumvsGPT-5.3 Chatnone