Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.7 Plus vs Z.ai: GLM 5.1

Сводка

Сравнение benchmark Qwen3.7 Plus vs GLM 5.1: Qwen3.7 Plus лидирует по среднему баллу: 7.2 vs 7.1. Qwen3.7 Plus имеет более низкую стоимость benchmark: $0.023 vs $0.292. Qwen3.7 Plus быстрее: 2.85s vs 33.67s, с долей успешных попыток 47.6% vs 68.3%.

Рекомендуемая модель: Qwen3.7 Plus - Здесь у него лучший балл (7.2), при этом он примерно в 13.2 раза дешевле, чем GLM 5.1.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03 GLM 5.1 GLM 5.1 medium Релиз: 2026-04-07
Оценка 7.2 7.1
Ранг #61 #64
Надежность 10.0 6.7
Стабильность 10.0 8.3
Тестов верно
Доля успешных попыток 47.6% 68.3%
Нестабильные тесты 0 4
Всего запусков 63 63
Стоимость за результат 0.276 2.496
Общая стоимость $0.023 $0.292
Цена входа $0.320 / 1M $0.980 / 1M
Цена выхода $1.280 / 1M $3.080 / 1M
Общее число входных токенов 42,510 32,995
Выходные токены 6,578 11,655
Токены рассуждений 0 75,421
Время ответа (среднее) 2.85s 33.67s
Время ответа (макс.) 29.38s 172.60s
Время ответа (суммарно) 59.86s 673.41s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Qwen3.7 Plus

none
Cost
$0.019
Time
213.5s
Tokens
11,960 tok

#64 GLM 5.1

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 555 401 5,122
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
GLM 5.1 4.6 3.7 44.5% 2 109.63s 5,702 4,871 37,826
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 17,298 327 4,206
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 7,107 991 4,552
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 489 969 11,314
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 477 2,875 2,875
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 634 204 1,617
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
GLM 5.1 8.2 7.2 88.9% 1 31.64s 609 935 5,730
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0
GLM 5.1 3.0 10.0 0.0% 0 29.40s 124 82 2,179

Быстрое сравнение

Сменить пару сравнения