AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-24

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	GPT-5.5 GPT-5.5 medium Релиз: 2026-04-24

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	GPT-5.5 GPT-5.5 medium Релиз: 2026-04-24
Оценка	8.6	9.0
Ранг	#7	#5
Надежность	Н/Д	Н/Д
Стабильность	8.8	9.2
Тестов верно
Доля успешных попыток	83.3%	87.0%
Нестабильные тесты	3	2
Всего запусков	54	54
Стоимость за результат	0.926	19.226
Общая стоимость	$0.121	$2.884
???? ?????	$0.250 / 1M	$5.000 / 1M
???? ??????	$2.000 / 1M	$30.000 / 1M
Выходные токены	3,257	1,920
Токены рассуждений	52,042	89,632
Время ответа (среднее)	30.37s	32.75s
Время ответа (макс.)	168.71s	332.10s
Время ответа (суммарно)	546.72s	589.59s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
GPT-5.5	10.0	10.0	100.0%	0		4.66s	250	1,335

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
GPT-5.5	10.0	10.0	100.0%	0		9.09s	318	1,391

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
GPT-5.5	10.0	10.0	100.0%	0		19.29s	312	2,841

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
GPT-5.5	10.0	10.0	100.0%	0		4.18s	234	593

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
GPT-5.5	5.3	7.2	44.4%	1		164.14s	67	79,625

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
GPT-5.5	10.0	10.0	100.0%	0		4.16s	138	223

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
GPT-5.5	10.0	10.0	100.0%	0		3.36s	93	538

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
GPT-5.5	8.6	7.9	77.8%	1		6.78s	250	2,254

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
GPT-5.5	10.0	10.0	100.0%	0		10.57s	258	832

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitemediumvsHY3 PreviewhighБесплатно доступно Gemini 3 Flash PreviewlowvsGPT-5.5medium Claude Opus 4.7nonevsGPT-5.5medium Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Seed-2.0-LitemediumvsDeepSeek V4 Prohigh Seed-2.0-LitemediumvsHY3 PreviewlowБесплатно доступно Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow GPT-5.5mediumvsHY3 PreviewhighБесплатно доступно Claude Opus 4.7nonevsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewnone