AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.7 Plus

Сводка

Сравнение benchmark Seed-2.0-Lite vs Qwen3.7 Plus: Qwen3.7 Plus лидирует по среднему баллу: 6.4 vs 5.8. Seed-2.0-Lite имеет более низкую стоимость benchmark: $0.019 vs $0.028. Seed-2.0-Lite быстрее: 2.49s vs 2.85s, с долей успешных попыток 46.0% vs 47.6%.

Рекомендуемая модель: Seed-2.0-Lite - Его балл близок к лучшему здесь (5.8 против 6.4), при этом он примерно в 1.5 раза дешевле, чем Qwen3.7 Plus.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-10

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03
Оценка	5.8	6.4
Ранг	#111	#89
Надежность	10.0	10.0
Стабильность	8.4	10.0
Тестов верно
Доля успешных попыток	46.0%	47.6%
Нестабильные тесты	4	0
Всего запусков	63	63
Стоимость за результат	0.228	0.276
Общая стоимость	$0.019	$0.028
Цена входа	$0.250 / 1M	$0.400 / 1M
Цена выхода	$2.000 / 1M	$1.600 / 1M
Общее число входных токенов	46,573	42,510
Выходные токены	3,259	6,578
Токены рассуждений	0	0
Время ответа (среднее)	2.49s	2.85s
Время ответа (макс.)	6.70s	29.38s
Время ответа (суммарно)	52.26s	59.86s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 Seed-2.0-Lite

none

Cost: $0.005
Time: 83.8s
Tokens: 2,311 tok

#89 Qwen3.7 Plus

none

Cost: $0.019
Time: 213.5s
Tokens: 11,960 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		29.38s	14,952	4,505	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3.1 Flash LiteminimalvsQwen3.7 Plusnone Seed-2.0-LitenonevsNemotron 3 SupermediumБесплатно доступно CobuddymediumvsSeed-2.0-Litenone GPT-5 NanomediumvsQwen3.7 Plusnone Mercury 2mediumvsQwen3.7 Plusnone Seed-2.0-LitenonevsDeepSeek V4 Prohigh gpt-oss-120bmediumБесплатно доступноvsQwen3.7 Plusnone Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Kimi K2.5mediumvsQwen3.7 Plusnone Ring-2.6-1TmediumvsQwen3.7 Plusnone Seed-2.0-LitenonevsMiniMax M2.5medium DeepSeek V4 ProhighvsQwen3.7 Plusnone