AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.5 Flash

Сводка

Сравнение benchmark Seed-2.0-Lite vs Gemini 3.5 Flash: Gemini 3.5 Flash лидирует по среднему баллу: 9.2 vs 8.5. Seed-2.0-Lite имеет более низкую стоимость benchmark: $0.175 vs $0.349. Gemini 3.5 Flash быстрее: 3.27s vs 47.07s, с долей успешных попыток 76.2% vs 90.5%.

Рекомендуемая модель: Gemini 3.5 Flash - Здесь у него лучший балл (9.2), и он отвечает примерно в 14.4 раза быстрее, чем Seed-2.0-Lite.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash low Релиз: 2026-05-19

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash low Релиз: 2026-05-19
Оценка	8.5	9.2
Ранг	#18	#5
Надежность	10.0	10.0
Стабильность	9.0	10.0
Тестов верно
Доля успешных попыток	76.2%	90.5%
Нестабильные тесты	3	0
Всего запусков	63	63
Стоимость за результат	1.250	1.834
Общая стоимость	$0.175	$0.349
Цена входа	$0.250 / 1M	$1.500 / 1M
Цена выхода	$2.000 / 1M	$9.000 / 1M
Общее число входных токенов	46,740	36,938
Выходные токены	3,230	2,033
Токены рассуждений	78,406	30,519
Время ответа (среднее)	47.07s	3.27s
Время ответа (макс.)	254.92s	9.05s
Время ответа (суммарно)	988.37s	68.65s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium

Стоимость: $0.005
Время: 86.7s
Токены: 2,354 tok

#5 Gemini 3.5 Flash

low

Стоимость: $0.068
Время: 39.1s
Токены: 7,588 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	494	209	2,536

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
Gemini 3.5 Flash	7.8	10.0	66.7%	0		6.71s	8,118	458	13,420

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.44s	12,873	351	3,050

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.81s	7,548	279	1,164

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
Gemini 3.5 Flash	7.7	10.0	66.7%	0		3.39s	633	12	4,538

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.27s	486	119	916

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
Gemini 3.5 Flash	9.9	10.0	100.0%	0		1.86s	615	71	1,652

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.35s	558	288	2,150

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.27s	5,457	234	403

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.88s	156	12	690

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitemediumvsGPT-5.2 Chatnone Claude Fable 5mediumvsGemini 3.5 Flashlow Gemini 3.5 FlashlowvsQwen3.7 Maxmedium Seed-2.0-LitemediumvsDeepSeek V4 Flashhigh Gemini 3.5 FlashlowvsGPT-5.5medium Gemini 3.5 FlashlowvsGPT-5.3-Codexmedium Gemini 3.5 FlashlowvsQwen3.6 Max Previewmedium Claude Opus 4.8mediumvsGemini 3.5 Flashlow Claude Opus 4.7mediumvsGemini 3.5 Flashlow Gemini 3.5 FlashlowvsGLM 5.2medium Gemini 3.5 FlashlowvsGLM 5medium Gemini 3.5 FlashlowvsGPT-5 Minimedium