AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-35B-A3B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-11

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Релиз: 2026-02-24

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Релиз: 2026-02-24
Оценка	6.2	6.1
Ранг	#58	#60
Стабильность	7.7	8.7
Тестов верно
Доля успешных попыток	55.6%	50.0%
Нестабильные тесты	5	3
Всего запусков	54	54
Стоимость за результат	0.200	0.215
Общая стоимость	$0.016	$0.016
???? ?????	$0.250 / 1M	$0.163 / 1M
???? ??????	$2.000 / 1M	$1.300 / 1M
Выходные токены	3,129	4,300
Токены рассуждений	0	0
Время ответа (среднее)	2.53s	3.82s
Время ответа (макс.)	6.70s	47.43s
Время ответа (суммарно)	45.46s	68.74s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
Qwen3.5-35B-A3B	3.4	7.9	16.7%	1		1.43s	574	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		4.61s	380	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		2.67s	539	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		47.43s	1,833	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		1.16s	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
Qwen3.5-35B-A3B	7.7	10.0	66.7%	0		485ms	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
Qwen3.5-35B-A3B	6.5	3.4	66.7%	1		1.19s	114	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
Qwen3.5-35B-A3B	6.3	10.0	50.0%	0		809ms	63	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
Qwen3.5-35B-A3B	3.9	7.4	22.2%	1		1.34s	655	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		2.30s	264	0

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitenonevsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.5-35B-A3Bnone gpt-oss-120bmediumБесплатно доступноvsQwen3.5-35B-A3Bnone Seed-2.0-Litenonevsgpt-oss-120bmediumБесплатно доступно Seed-2.0-LitenonevsMercury 2medium Mercury 2mediumvsQwen3.5-35B-A3Bnone MiniMax M2.5mediumБесплатно доступноvsQwen3.5-35B-A3Bnone Mistral Small 4mediumvsQwen3.5-35B-A3Bnone Seed-2.0-LitenonevsMiniMax M2.5mediumБесплатно доступно Seed-2.0-LitenonevsGrok 4.1 Fastmedium Seed-2.0-LitenonevsMistral Small 4medium Qwen3.5-35B-A3BnonevsGrok 4.1 Fastmedium