AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.2

Сводка

Сравнение benchmark Seed-2.0-Lite vs GPT-5.2: Seed-2.0-Lite лидирует по среднему баллу: 8.5 vs 8.4. Seed-2.0-Lite имеет более низкую стоимость benchmark: $0.175 vs $0.548. GPT-5.2 быстрее: 16.88s vs 47.07s, с долей успешных попыток 76.2% vs 71.4%.

Рекомендуемая модель: Seed-2.0-Lite - Здесь у него лучший балл (8.5), при этом он примерно в 3.1 раза дешевле, чем GPT-5.2.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11
Оценка	8.5	8.4
Ранг	#18	#22
Надежность	10.0	10.0
Стабильность	9.0	8.4
Тестов верно
Доля успешных попыток	76.2%	71.4%
Нестабильные тесты	3	4
Всего запусков	63	63
Стоимость за результат	1.250	4.209
Общая стоимость	$0.175	$0.548
Цена входа	$0.250 / 1M	$1.750 / 1M
Цена выхода	$2.000 / 1M	$14.000 / 1M
Общее число входных токенов	46,740	33,967
Выходные токены	3,230	2,901
Токены рассуждений	78,406	31,932
Время ответа (среднее)	47.07s	16.88s
Время ответа (макс.)	254.92s	77.80s
Время ответа (суммарно)	988.37s	236.34s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium

Стоимость: $0.005
Время: 86.7s
Токены: 2,354 tok

#22 GPT-5.2

medium

Стоимость: $0.047
Время: 49.2s
Токены: 3,396 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
GPT-5.2	6.5	8.0	58.3%	1		7.81s	606	567	2,002

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
GPT-5.2	10.0	10.0	100.0%	0		22.73s	7,302	511	11,912

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
GPT-5.2	10.0	10.0	100.0%	0		14.06s	11,019	291	1,757

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
GPT-5.2	10.0	10.0	100.0%	0		3.15s	7,140	234	420

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
GPT-5.2	5.9	7.2	55.6%	1		77.80s	473	42	10,342

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
GPT-5.2	3.7	9.7	0.0%	0		4.32s	477	162	269

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
GPT-5.2	9.9	10.0	100.0%	0		3.12s	660	94	614

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
GPT-5.2	7.5	7.3	77.8%	1		5.80s	642	735	924

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
GPT-5.2	4.7	1.6	66.7%	1		10.30s	5,453	239	469

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
GPT-5.2	3.0	10.0	0.0%	0		28.18s	195	26	3,223

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitemediumvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGPT-5.2medium Seed-2.0-LitemediumvsDeepSeek V4 Flashhigh Claude Opus 4.8lowvsGPT-5.2medium GPT-5.2mediumvsStep 3.7 Flashlow Claude Opus 4.8lowvsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGemini 3.5 Flashlow DeepSeek V4 ProhighvsGPT-5.2medium Seed-2.0-LitemediumvsStep 3.7 Flashlow Seed-2.0-LitemediumvsGPT-5.5low Gemini 3.5 FlashlowvsGPT-5.2medium Seed-2.0-LitemediumvsDeepSeek V4 Prohigh