AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: gpt-oss-120b

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-26

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	gpt-oss-120b gpt-oss-120b none Релиз: 2025-08-05 Бесплатно доступно

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	gpt-oss-120b gpt-oss-120b none Релиз: 2025-08-05 Бесплатно доступно
Оценка	5.9	5.4
Ранг	#100	#119
Надежность	10.0	10.0
Стабильность	8.3	9.1
Тестов верно
Доля успешных попыток	48.3%	38.6%
Нестабильные тесты	4	2
Всего запусков	98	133
Стоимость за результат	0.405	0.302
Общая стоимость	$0.033	$0.019
???? ?????	$0.250 / 1M	$0.000 / 1M
???? ??????	$2.000 / 1M	$0.000 / 1M
Выходные токены	10,283	91,564
Токены рассуждений	0	0
Время ответа (среднее)	2.48s	21.61s
Время ответа (макс.)	6.70s	113.71s
Время ответа (суммарно)	49.67s	345.79s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.8	9.9	50.0%	0		2.95s	404	0
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	10,870	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	7,739	0
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	34,952	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	11	0
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.5mediumБесплатно доступноvsgpt-oss-120bnoneБесплатно доступно Mistral Small 4mediumvsgpt-oss-120bnoneБесплатно доступно Seed-2.0-LitenonevsOwl Alphamedium Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Seed-2.0-LitenonevsNemotron 3 SupermediumБесплатно доступно gpt-oss-120bnoneБесплатно доступноvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneБесплатно доступно CobuddymediumБесплатно доступноvsSeed-2.0-Litenone Seed-2.0-LitenonevsGPT-5 Nanomedium CobuddymediumБесплатно доступноvsgpt-oss-120bnoneБесплатно доступно gpt-oss-120bnoneБесплатно доступноvsOwl Alphamedium Seed-2.0-LitenonevsMiniMax M2.5mediumБесплатно доступно