AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.4 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17
Ранг	#47	#28
Оценка	6.0	7.4
Стабильность	7.6	9.0
Стоимость за результат	0.215	0.769
Общая стоимость	$0.016	$0.077
Тестов верно
Доля успешных попыток	52.9%	66.7%
Нестабильные тесты	5	2
Всего запусков	51	51
Выходные токены	2,749	2,474
Токены рассуждений	0	54,516
Время ответа (среднее)	2.40s	11.08s
Время ответа (макс.)	6.70s	94.06s
Время ответа (суммарно)	40.85s	188.39s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	683	2,254

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	349	5,719

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	234	516

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	60	43,325

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	179	443

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	95	521

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
GPT-5.4 Nano	4.0	7.1	22.2%	1		3.65s	640	1,356

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	234	382

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Seed-2.0-LitenonevsMiniMax M2.5mediumБесплатно доступно Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-LitenonevsMercury 2medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium Seed-2.0-LitenonevsMistral Small 4medium Gemini 3 Flash PreviewnonevsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4 Nanomedium GPT-5.4 NanomediumvsQwen3.5 Plus 2026-02-15none GPT-5.4 NanomediumvsGLM 5none