Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Z.ai: GLM 5 Turbo

Сводка

Сравнение benchmark DeepSeek V4 Flash vs GLM 5 Turbo: GLM 5 Turbo лидирует по среднему баллу: 8.4 vs 8.3. DeepSeek V4 Flash имеет более низкую стоимость benchmark: $0.029 vs $0.323. GLM 5 Turbo быстрее: 23.00s vs 45.85s, с долей успешных попыток 74.6% vs 74.6%.

Рекомендуемая модель: DeepSeek V4 Flash - Его балл близок к лучшему здесь (8.3 против 8.4), при этом он примерно в 11.3 раза дешевле, чем GLM 5 Turbo.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика DeepSeek V4 Flash DeepSeek V4 Flash high Релиз: 2026-04-24 GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15
Оценка 8.3 8.4
Ранг #26 #24
Надежность 10.0 10.0
Стабильность 8.5 8.5
Тестов верно
Доля успешных попыток 74.6% 74.6%
Нестабильные тесты 4 4
Всего запусков 63 63
Стоимость за результат 0.299 2.011
Общая стоимость $0.029 $0.323
Цена входа $0.098 / 1M $1.200 / 1M
Цена выхода $0.196 / 1M $4.000 / 1M
Общее число входных токенов 39,745 35,593
Выходные токены 10,310 12,245
Токены рассуждений 123,501 62,277
Время ответа (среднее) 45.85s 23.00s
Время ответа (макс.) 218.13s 194.23s
Время ответа (суммарно) 962.79s 482.97s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#26 DeepSeek V4 Flash

high
Cost
$0.003
Time
93.1s
Tokens
7,926 tok

#24 GLM 5 Turbo

medium
Cost
$0.074
Time
206.0s
Tokens
18,549 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 540 140 7,770
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 555 362 3,137
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 7.8 10.0 66.7% 0 50.60s 7,279 395 34,862
GLM 5 Turbo 8.2 9.3 66.7% 0 45.90s 5,941 363 25,381
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 14,016 465 7,347
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 12,714 390 2,037
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 7,290 201 1,179
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 7,107 577 3,632
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 666 27 59,249
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 489 9,665 19,279
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 471 79 632
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 477 60 2,216
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 627 63 1,622
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 636 255 2,183
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 594 196 1,767
GLM 5 Turbo 8.7 7.9 77.8% 1 5.23s 609 312 2,647
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 8,079 228 542
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 6,879 241 446
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 183 8,516 8,531
GLM 5 Turbo 3.0 10.0 0.0% 0 40.17s 186 20 1,319

Быстрое сравнение

Сменить пару сравнения