AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-12

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	GPT-5 Nano GPT-5 Nano medium Релиз: 2025-08-07

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	GPT-5 Nano GPT-5 Nano medium Релиз: 2025-08-07
Ранг	#45	#38
Средний балл	4.9	5.5
Стабильность	7.4	7.0
Стоимость за результат	0.214	0.856
Общая стоимость	$0.015	$0.060
Тестов верно
Доля успешных попыток	56.3%	60.4%
Нестабильные тесты	5	6
Всего запусков	48	48
Выходные токены	2,743	4,386
Токены рассуждений	0	142,080
Время ответа (среднее)	2.49s	47.94s
Время ответа (макс.)	6.70s	204.02s
Время ответа (суммарно)	39.91s	431.47s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Общее число выходных токенов

Средний балл vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	4.6	22.2%	2		2.93s	703	0
GPT-5 Nano	7.0	10.0	66.7%	0		37.73s	1,107	19,968

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	0.0%	0		6.59s	498	0
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	578	17,984

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.9	10.0	100.0%	0		1.82s	246	0
GPT-5 Nano	10.0	1.7	50.0%	2		21.42s	453	10,560

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	7.2	22.2%	1		1.33s	17	0
GPT-5 Nano	4.0	4.4	55.6%	2		204.02s	237	64,448

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5 Nano	3.0	10.0	0.0%	0		17.51s	202	4,608

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5 Nano	9.0	6.8	83.3%	1		11.90s	382	4,096

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	4.0	4.4	55.6%	2		2.46s	620	0
GPT-5 Nano	4.0	7.2	44.4%	1		19.81s	869	13,440

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	558	6,976

Быстрое сравнение

Сменить пару сравнения

DeepSeek V3.2nonevsGPT-5 Nanomedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Seed-2.0-LitenonevsMiniMax M2.5medium GPT-5 NanomediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsGPT-5 Nanomedium Seed-2.0-LitenonevsMercury 2medium GPT-5 NanomediumvsGLM 5none GPT-5 NanomediumvsQwen3.5-122B-A10Bnone Seed-2.0-LitenonevsQwen3.5-35B-A3Bmedium GPT-5 NanomediumvsQwen3.5-27Bnone GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none