AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.4 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	GPT-5.4 Mini GPT-5.4 Mini medium Релиз: 2026-03-17

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	GPT-5.4 Mini GPT-5.4 Mini medium Релиз: 2026-03-17
Ранг	#47	#34
Оценка	6.0	7.1
Стабильность	7.6	7.2
Стоимость за результат	0.215	3.610
Общая стоимость	$0.016	$0.289
Тестов верно
Доля успешных попыток	52.9%	68.6%
Нестабильные тесты	5	6
Всего запусков	51	51
Выходные токены	2,749	1,708
Токены рассуждений	0	58,019
Время ответа (среднее)	2.40s	15.66s
Время ответа (макс.)	6.70s	102.91s
Время ответа (суммарно)	40.85s	266.14s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	296	2,876

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		17.81s	317	4,317

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	234	650

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	60	43,286

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	150	510

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5.4 Mini	7.4	6.5	66.7%	1		2.50s	129	1,337

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
GPT-5.4 Mini	6.8	7.9	55.6%	1		4.33s	271	2,449

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	251	2,594

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Seed-2.0-LitenonevsMiniMax M2.5mediumБесплатно доступно Claude Sonnet 4.6nonevsGPT-5.4 Minimedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-LitenonevsMercury 2medium GPT-5.4 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5.4 MinimediumvsGLM 5none Seed-2.0-LitenonevsMistral Small 4medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Minimedium DeepSeek V3.2nonevsGPT-5.4 Minimedium Seed-2.0-LitenonevsGPT-5 Minimedium