ByteDance Seed: Seed-2.0-Lite vs OpenAI: gpt-oss-120b

Seed-2.0-Lite лидирует по среднему баллу: 6.2 vs 6.1. gpt-oss-120b (medium) имеет более низкую стоимость benchmark: $0.019 vs $0.066. Seed-2.0-Lite быстрее: 4.40s vs 21.91s, с долей успешных попыток 43.9% vs 50.0%.

Рекомендуемая модельSeed-2.0-LiteЗдесь у него лучший балл (6.2), и он отвечает примерно в 5.0 раза быстрее, чем gpt-oss-120b (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Сводка сравнения

Ранг: #127
Общее число выходных токенов: 14,746
Время ответа (среднее): 4.40s
Общая стоимость: $0.066

Ранг: #132
Общее число выходных токенов: 97,816
Время ответа (среднее): 21.91s
Общая стоимость: $0.019

Подробное сравнение

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05
Оценка	6.2	6.1
Ранг	#127	#132
Надежность	10.0	10.0
Стабильность	8.5	8.0
Тестов верно
Доля успешных попыток	43.9%	50.0%
Нестабильные тесты	4	5
Всего запусков	66	66
Стоимость за результат	0.814	0.221
Общая стоимость	$0.066	$0.019
Цена входа	$0.250 / 1M	$0.037 / 1M
Цена выхода	$2.000 / 1M	$0.170 / 1M
Общее число входных токенов	142,197	108,747
Выходные токены	14,746	29,772
Токены рассуждений	0	68,044
Время ответа (среднее)	4.40s	21.91s
Время ответа (макс.)	44.58s	68.16s
Время ответа (суммарно)	96.84s	328.70s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#127 Seed-2.0-Lite

none

Стоимость: $0.005
Время: 83.8s
Токены: 2,311 tok

#132 gpt-oss-120b

medium

Стоимость: $0.001
Время: 26.7s
Токены: 555 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	1,314	3,518	2,177

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
gpt-oss-120b	5.9	7.0	55.6%	1		38.37s	7,782	3,365	11,973

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		25.58s	111,839	11,985	0
gpt-oss-120b	6.5	10.0	50.0%	0		23.96s	81,198	10,453	22,883

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	7,476	241	1,114

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	1,266	6,784	20,606

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	659	107	387

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	1,036	126	1,799

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,190	1,790	2,264

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	6,514	287	1,083

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	312	3,101	3,758

Быстрое сравнение

Сменить пару сравнения

Gemini 3.1 Flash Litenonevsgpt-oss-120bmedium Seed-2.0-LitenonevsGPT-5.6 Lunalow gpt-oss-120bmediumvsInklinglow gpt-oss-120bmediumvsQwen3.6 Flashnone Gemini 3.1 Flash Liteminimalvsgpt-oss-120bmedium gpt-oss-120bmediumvsQwen3.5-Flashnone gpt-oss-120bmediumvsQwen3.5 Plus 2026-04-20none Seed-2.0-LitenonevsQwen3.5-Flashmedium gpt-oss-120bmediumvsQwen3.5-35B-A3Bnone Seed-2.0-LitenonevsQwen3.5-35B-A3Bmedium Gemini 2.5 Flashnonevsgpt-oss-120bmedium Nemotron 3 UltranoneБесплатно доступноvsgpt-oss-120bmedium