AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Flash Lite

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite high Релиз: 2026-05-08

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite high Релиз: 2026-05-08
Оценка	8.1	7.5
Ранг	#21	#48
Надежность	10.0	9.8
Стабильность	8.9	8.1
Тестов верно
Доля успешных попыток	75.0%	74.1%
Нестабильные тесты	3	4
Всего запусков	60	54
Стоимость за результат	1.170	18.579
Общая стоимость	$0.153	$2.044
???? ?????	$0.250 / 1M	$0.250 / 1M
???? ??????	$2.000 / 1M	$1.500 / 1M
Выходные токены	3,282	1,984
Токены рассуждений	67,287	1,355,583
Время ответа (среднее)	36.79s	61.96s
Время ответа (макс.)	168.71s	149.23s
Время ответа (суммарно)	735.86s	1115.31s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
Gemini 3.1 Flash Lite	9.4	10.0	100.0%	0		37.16s	100	130,598

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	7.0	9.7	50.0%	0		107.65s	452	20,524
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		137.63s	666	188,733

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		149.23s	327	198,243

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.49s	279	7,351

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
Gemini 3.1 Flash Lite	3.6	7.2	22.2%	1		139.90s	18	566,210

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
Gemini 3.1 Flash Lite	5.0	2.1	66.7%	1		45.69s	95	64,644

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
Gemini 3.1 Flash Lite	7.3	5.8	83.3%	1		23.26s	52	3,549

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
Gemini 3.1 Flash Lite	5.7	6.8	44.4%	1		50.83s	213	193,654

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		6.44s	234	2,601

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	9	2,040
Gemini 3.1 Flash Lite	-	-	-	-	-	-	-	-

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitemediumvsGemini 3.5 Flashminimal Seed-2.0-LitemediumvsQwen3.7 Maxnone Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Litelow Seed-2.0-LitemediumvsGPT-5.3 Chatnone Seed-2.0-LitemediumvsDeepSeek V4 FlashhighБесплатно доступно Seed-2.0-LitemediumvsRing-2.6-1Tnone Seed-2.0-LitemediumvsGemini 3.5 Flashnone