AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.6 27B

Сводка

Сравнение benchmark Seed-2.0-Lite vs Qwen3.6 27B: Qwen3.6 27B лидирует по среднему баллу: 6.6 vs 6.2. Seed-2.0-Lite имеет более низкую стоимость benchmark: $0.019 vs $0.440. Seed-2.0-Lite быстрее: 2.49s vs 59.71s, с долей успешных попыток 46.0% vs 60.3%.

Рекомендуемая модель: Seed-2.0-Lite - Его балл близок к лучшему здесь (6.2 против 6.6), при этом он примерно в 24.2 раза дешевле, чем Qwen3.6 27B.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	Qwen3.6 27B Qwen3.6 27B medium Релиз: 2026-04-20

Метрика	Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14	Qwen3.6 27B Qwen3.6 27B medium Релиз: 2026-04-20
Оценка	6.2	6.6
Ранг	#92	#81
Надежность	10.0	10.0
Стабильность	8.4	8.2
Тестов верно
Доля успешных попыток	46.0%	60.3%
Нестабильные тесты	4	5
Всего запусков	63	63
Стоимость за результат	0.228	3.361
Общая стоимость	$0.019	$0.440
Цена входа	$0.250 / 1M	$0.289 / 1M
Цена выхода	$2.000 / 1M	$3.170 / 1M
Общее число входных токенов	46,573	39,376
Выходные токены	3,259	16,189
Токены рассуждений	0	122,521
Время ответа (среднее)	2.49s	59.71s
Время ответа (макс.)	6.70s	168.22s
Время ответа (суммарно)	52.26s	1254.01s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#92 Seed-2.0-Lite

none

Стоимость: $0.005
Время: 83.8s
Токены: 2,311 tok

#81 Qwen3.6 27B

medium

Стоимость: $0.009
Время: 39.6s
Токены: 3,090 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	453	582	4,311

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Qwen3.6 27B	7.7	10.0	66.7%	0		142.99s	5,051	7,968	43,367

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Qwen3.6 27B	7.0	3.7	66.7%	1		83.07s	15,104	2,088	14,689

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	7,778	568	9,404

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	662	3,510	20,352

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	516	81	3,045

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	699	346	6,548

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Qwen3.6 27B	7.7	10.0	66.7%	0		61.14s	696	255	12,044

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	8,213	390	2,954

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	204	401	5,807

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitenonevsGemini 3.1 Flash Liteminimal Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 27Bmedium Seed-2.0-LitenonevsQwen3.5-35B-A3Bmedium Seed-2.0-LitenonevsGemma 4 31BmediumБесплатно доступно Seed-2.0-LitenonevsNemotron 3 SupermediumБесплатно доступно Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 27Bmedium Gemini 3.1 Flash LitelowvsQwen3.6 27Bmedium Gemini 3.5 FlashminimalvsQwen3.6 27Bmedium Seed-2.0-LitenonevsGemini 3.1 Flash Litelow Seed-2.0-LitenonevsGemini 3.1 Flash Lite Previewlow GPT-5.5nonevsQwen3.6 27Bmedium Gemini 3 Flash PreviewnonevsQwen3.6 27Bmedium