AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Z.ai: GLM 5

Сводка

Сравнение benchmark Seed-2.0-Lite vs GLM 5: GLM 5 лидирует по среднему баллу: 8.6 vs 8.5. Seed-2.0-Lite имеет более низкую стоимость benchmark: $0.175 vs $0.228. GLM 5 быстрее: 33.54s vs 47.07s, с долей успешных попыток 76.2% vs 82.5%.

Рекомендуемая модель: GLM 5 - У него самый высокий балл в этом сравнении (8.6) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	GLM 5 GLM 5 medium Релиз: 2026-02-12

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	GLM 5 GLM 5 medium Релиз: 2026-02-12
Оценка	8.5	8.6
Ранг	#18	#15
Надежность	10.0	10.0
Стабильность	9.0	8.5
Тестов верно
Доля успешных попыток	76.2%	82.5%
Нестабильные тесты	3	4
Всего запусков	63	63
Стоимость за результат	1.250	1.668
Общая стоимость	$0.175	$0.228
Цена входа	$0.250 / 1M	$0.600 / 1M
Цена выхода	$2.000 / 1M	$1.920 / 1M
Общее число входных токенов	46,740	35,224
Выходные токены	3,230	21,570
Токены рассуждений	78,406	102,996
Время ответа (среднее)	47.07s	33.54s
Время ответа (макс.)	254.92s	99.85s
Время ответа (суммарно)	988.37s	435.99s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium

Стоимость: $0.005
Время: 86.7s
Токены: 2,354 tok

#15 GLM 5

medium

Стоимость: $0.005
Время: 20.7s
Токены: 2,068 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
GLM 5	10.0	10.0	100.0%	0		28.96s	12,804	662	3,242

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitemediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5medium Seed-2.0-LitemediumvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsGLM 5medium Gemini 3.5 FlashlowvsGLM 5medium Claude Opus 4.8lowvsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGemini 3.5 Flashlow GPT-5.5lowvsGLM 5medium Seed-2.0-LitemediumvsStep 3.7 Flashlow Claude Opus 4.8lowvsGLM 5medium Seed-2.0-LitemediumvsGPT-5.5low Step 3.7 FlashlowvsGLM 5medium