AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Z.ai: GLM 5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-15

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	GLM 5 GLM 5 medium Релиз: 2026-02-12

Метрика	Seed-2.0-Lite Seed-2.0-Lite medium Релиз: 2026-02-14	GLM 5 GLM 5 medium Релиз: 2026-02-12
Ранг	#3	#13
Оценка	8.8	8.2
Стабильность	8.7	8.0
Стоимость за результат	0.870	0.933
Общая стоимость	$0.105	$0.103
Тестов верно
Доля успешных попыток	87.5%	83.3%
Нестабильные тесты	3	4
Всего запусков	48	48
Выходные токены	2,815	19,773
Токены рассуждений	44,618	36,459
Время ответа (среднее)	29.39s	16.16s
Время ответа (макс.)	168.71s	28.96s
Время ответа (суммарно)	470.29s	129.26s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		23.34s	990	7,037
GLM 5	10.0	10.0	100.0%	0		22.26s	420	4,992

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
GLM 5	10.0	10.0	100.0%	0		28.96s	662	3,242

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
GLM 5	7.1	5.6	83.3%	1		8.90s	567	3,734

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
GLM 5	3.5	4.4	33.3%	2		0ms	13,176	14,137

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
GLM 5	6.1	3.1	66.7%	1		14.69s	2,020	2,248

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
GLM 5	10.0	10.0	100.0%	0		7.25s	1,001	2,129

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
GLM 5	10.0	10.0	100.0%	0		15.64s	1,694	4,983

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
GLM 5	10.0	10.0	100.0%	0		15.93s	233	994

Быстрое сравнение

Сменить пару сравнения

Seed-2.0-LitemediumvsGemini 3 Flash Previewlow GPT-5.2 ChatnonevsGLM 5medium Gemini 3 Flash PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium GPT-5.3 ChatnonevsGLM 5medium Gemini 3 Flash PreviewlowvsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Claude Sonnet 4.6nonevsGLM 5medium Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-LitemediumvsGPT-5.3 Chatnone