AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.5 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash medium Релиз: 2026-05-19

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash medium Релиз: 2026-05-19
Оценка	8.3	9.2
Ранг	#15	#5
Надежность	10.0	10.0
Стабильность	8.9	10.0
Тестов верно
Доля успешных попыток	79.0%	89.5%
Нестабильные тесты	3	0
Всего запусков	57	57
Стоимость за результат	0.958	2.307
Общая стоимость	$0.125	$0.393
???? ?????	$0.250 / 1M	$1.500 / 1M
???? ??????	$2.000 / 1M	$9.000 / 1M
Выходные токены	3,266	1,971
Токены рассуждений	54,082	36,659
Время ответа (среднее)	31.32s	3.90s
Время ответа (макс.)	168.71s	12.05s
Время ответа (суммарно)	595.04s	74.13s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.09s	171	3,385

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
Gemini 3.5 Flash	10.0	10.0	100.0%	0		8.22s	431	5,190

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
Gemini 3.5 Flash	10.0	10.0	100.0%	0		12.05s	351	7,807

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
Gemini 3.5 Flash	10.0	10.0	100.0%	0		4.07s	279	3,784

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
Gemini 3.5 Flash	7.7	10.0	66.7%	0		5.24s	12	8,047

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	115	1,144

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
Gemini 3.5 Flash	9.9	10.0	100.0%	0		2.70s	71	2,855

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
Gemini 3.5 Flash	7.7	10.0	66.7%	0		2.38s	295	2,747

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.81s	234	455

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	9	2,040
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.75s	12	1,245

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitemediumvsGemini 3.5 Flashminimal Gemini 3.5 FlashmediumvsGPT-5.5low Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Seed-2.0-LitemediumvsGPT-5.5low Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewnone Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3.1 Flash Litelow Seed-2.0-LitemediumvsGPT-5.3 Chatnone Seed-2.0-LitemediumvsDeepSeek V4 FlashhighБесплатно доступно Seed-2.0-LitemediumvsGemini 3.5 Flashnone