Seed-2.0-Lite (medium) vs Gemini 3.5 Flash (high)

Gemini 3.5 Flash (high) лидирует по среднему баллу: 9.5 vs 7.9. Seed-2.0-Lite (medium) имеет более низкую стоимость benchmark: $0.234 vs $1.976. Gemini 3.5 Flash (high) быстрее: 15.07s vs 48.53s, с долей успешных попыток 74.2% vs 93.9%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #42
Общее число выходных токенов: 100,580
Время ответа (среднее): 48.53s
Общая стоимость: $0.234

Ранг: #4
Общее число выходных токенов: 201,677
Время ответа (среднее): 15.07s
Общая стоимость: $1.976

Рекомендуемая модель Gemini 3.5 Flash (high)

Здесь у него лучший балл (9.5), и он отвечает примерно в 3.2 раза быстрее, чем Seed-2.0-Lite (medium).

Подробное сравнение

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19
Оценка	7.9	9.5
Ранг	#42	#4
Надежность	10.0	10.0
Стабильность	8.6	9.3
Тестов верно
Доля успешных попыток	74.2%	93.9%
Нестабильные тесты	4	2
Всего запусков	66	66
Стоимость за результат	1.669	9.879
Общая стоимость	$0.234	$1.976
Цена входа	$0.250 / 1M	$1.500 / 1M
Цена выхода	$2.000 / 1M	$9.000 / 1M
Общее число входных токенов	129,897	107,137
Выходные токены	12,533	8,777
Токены рассуждений	88,047	192,900
Время ответа (среднее)	48.53s	15.07s
Время ответа (макс.)	254.92s	145.92s
Время ответа (суммарно)	1067.74s	331.48s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#42 Seed-2.0-Lite

medium

Стоимость: $0.005
Время: 86.7s
Токены: 2,354 tok

#4 Gemini 3.5 Flash

high

Стоимость: $0.208
Время: 118.2s
Токены: 23,158 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.57s	492	174	4,997

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
Gemini 3.5 Flash	10.0	10.0	100.0%	0		22.96s	8,118	456	47,129

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.4	5.8	66.7%	1		58.52s	99,411	9,809	13,940
Gemini 3.5 Flash	8.2	6.9	66.7%	1		84.14s	82,416	7,153	93,585

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.43s	7,548	279	8,466

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
Gemini 3.5 Flash	7.6	7.2	77.8%	1		14.09s	633	12	24,721

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.63s	486	115	1,650

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.35s	615	70	3,799

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.23s	558	241	4,940

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
Gemini 3.5 Flash	9.8	10.0	100.0%	0		4.96s	6,115	265	1,608

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.94s	156	12	2,005

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashhighvsGPT-5.6 Sollow Seed-2.0-LitemediumvsGPT-5.6 Terrahigh Seed-2.0-LitemediumvsKimi K3max Claude Opus 4.8lowvsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGLM 5.2high Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsInklinghigh Seed-2.0-LitemediumvsGemini 3.5 Flash-Litehigh Gemini 3.5 FlashhighvsGPT-5.6 Solmedium Seed-2.0-LitemediumvsMuse Spark 1.1high Seed-2.0-LitemediumvsGPT-5.6 Lunahigh Gemini 3.5 FlashhighvsGPT-5.5low