AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Flash Lite Preview

Сводка

Сравнение benchmark Seed-2.0-Lite vs Gemini 3.1 Flash Lite Preview: Seed-2.0-Lite лидирует по среднему баллу: 8.2 vs 7.2. Gemini 3.1 Flash Lite Preview имеет более низкую стоимость benchmark: $0.018 vs $0.175. Gemini 3.1 Flash Lite Preview быстрее: 1.21s vs 47.07s, с долей успешных попыток 76.2% vs 60.3%.

Рекомендуемая модель: Gemini 3.1 Flash Lite Preview - Он дает лучший общий компромисс: конкурентный балл (7.2), ниже стоимость, чем у Seed-2.0-Lite, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-10

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03
Оценка	8.2	7.2
Ранг	#20	#59
Надежность	10.0	10.0
Стабильность	9.0	9.7
Тестов верно
Доля успешных попыток	76.2%	60.3%
Нестабильные тесты	3	1
Всего запусков	63	63
Стоимость за результат	1.250	0.148
Общая стоимость	$0.175	$0.018
Цена входа	$0.250 / 1M	$0.250 / 1M
Цена выхода	$2.000 / 1M	$1.500 / 1M
Общее число входных токенов	46,740	37,582
Выходные токены	3,230	5,547
Токены рассуждений	78,406	0
Время ответа (среднее)	47.07s	1.21s
Время ответа (макс.)	254.92s	3.39s
Время ответа (суммарно)	988.37s	25.45s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Seed-2.0-Lite

medium

Cost: $0.005
Time: 86.7s
Tokens: 2,354 tok

#59 Gemini 3.1 Flash Lite Preview

none

Cost: $0.003
Time: 4.7s
Tokens: 1,827 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		3.20s	13,026	339	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0

Быстрое сравнение

Сменить пару сравнения