AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-26

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07
Оценка	6.2	7.0
Ранг	#72	#53
Надежность	Н/Д	Н/Д
Стабильность	7.7	8.6
Тестов верно
Доля успешных попыток	55.6%	61.1%
Нестабильные тесты	5	3
Всего запусков	54	54
Стоимость за результат	0.200	1.415
Общая стоимость	$0.016	$0.128
???? ?????	$0.250 / 1M	$0.250 / 1M
???? ??????	$2.000 / 1M	$2.000 / 1M
Выходные токены	3,129	6,379
Токены рассуждений	0	53,482
Время ответа (среднее)	2.53s	23.98s
Время ответа (макс.)	6.70s	88.15s
Время ответа (суммарно)	45.46s	431.56s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	1,715	6,378

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		4.61s	380	0
GPT-5 Mini	10.0	10.0	100.0%	0		23.18s	483	4,160

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	453	3,200

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	293	14,016

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	349	1,856

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5 Mini	8.0	6.6	83.3%	1		15.66s	318	4,992

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
GPT-5 Mini	5.6	9.8	33.3%	0		14.09s	1,527	5,760

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitenonevsGPT-5 Nanomedium Gemma 4 31BnoneБесплатно доступноvsGPT-5 Minimedium DeepSeek V4 ProhighvsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Seed-2.0-LitenonevsMercury 2medium DeepSeek V4 PrononevsGPT-5 Minimedium GPT-5 MinimediumvsGLM 5none Claude Sonnet 4.6nonevsGPT-5 Minimedium Seed-2.0-LitenonevsMiniMax M2.5mediumБесплатно доступно Seed-2.0-LitenonevsGrok 4.1 Fastmedium Seed-2.0-LitenonevsMistral Small 4medium