AI BENCHY Compare

Сравниваемые модели

Сводка

Бенчмарк-сравнение Qwen3.5 Plus 2026-02-15 vs Qwen3.6 Plus Preview vs GLM 5 TurboGLM 5 Turbo лидирует по Оценка со значением 8.4. Qwen3.5 Plus 2026-02-15 лидирует по Надежность со значением 10.0. У Qwen3.6 Plus Preview самый низкий Общая стоимость: $0.000. Qwen3.6 Plus Preview самый быстрый: 15.25s.

Рекомендуемая модель: GLM 5 Turbo - Здесь у него лучший балл (8.4), и он отвечает примерно в 1.9 раза быстрее, чем другие модели в этом сравнении.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Релиз: 2026-02-15	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Релиз: 2026-04-20 Бесплатно доступно	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15

Метрика	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Релиз: 2026-02-15	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Релиз: 2026-04-20 Бесплатно доступно	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15
Оценка	8.0	5.8	8.4
Ранг	#28	#113	#21
Надежность	10.0	Н/Д	10.0
Стабильность	8.8	9.0	8.5
Тестов верно
Доля успешных попыток	73.0%	42.9%	74.6%
Нестабильные тесты	3	0	4
Всего запусков	63	57	63
Стоимость за результат	2.445	0.000	2.011
Общая стоимость	$0.310	$0.000	$0.323
Цена входа	$0.260 / 1M	$0.000 / 1M	$1.200 / 1M
Цена выхода	$1.560 / 1M	$0.000 / 1M	$4.000 / 1M
Общее число входных токенов	40,918	32,639	35,593
Выходные токены	2,159	1,153	12,245
Токены рассуждений	189,604	62,197	62,277
Время ответа (среднее)	73.79s	15.25s	23.00s
Время ответа (макс.)	266.69s	43.55s	194.23s
Время ответа (суммарно)	1033.07s	182.96s	482.97s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#28 Qwen3.5 Plus 2026-02-15

medium

Стоимость: $0.011
Время: 125.5s
Токены: 7,040 tok

#113 Qwen3.6 Plus Preview

medium

Для этой модели еще не сгенерирован результат showcase.

Стоимость: $0.000
Время: -
Токены: 0 tok

#21 GLM 5 Turbo

medium

Стоимость: $0.074
Время: 206.0s
Токены: 18,549 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1	45.78s	672	205	21,236
Qwen3.6 Plus Preview	8.3	10.0	75.0%	0	11.69s	501	61	5,812
GLM 5 Turbo	10.0	10.0	100.0%	0	4.82s	555	362	3,137

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	6.6	7.1	44.4%	1	180.70s	6,950	420	80,595
Qwen3.6 Plus Preview	9.8	3.3	0.0%	0	0ms	0	0	0
GLM 5 Turbo	8.2	9.3	66.7%	0	45.90s	5,941	363	25,381

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	46.85s	14,934	421	7,906
Qwen3.6 Plus Preview	10.0	10.0	100.0%	34.95s	14,934	452	13,073
GLM 5 Turbo	10.0	10.0	100.0%	13.88s	12,714	390	2,037

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	46.91s	7,782	270	14,916
Qwen3.6 Plus Preview	10.0	10.0	100.0%	14.95s	7,782	270	10,706
GLM 5 Turbo	10.0	10.0	100.0%	6.19s	7,107	577	3,632

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0	17.50s	444	35	16,680
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0	22.08s	665	49	26,895
GLM 5 Turbo	2.9	4.4	22.2%	2	71.07s	489	9,665	19,279

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1	79.86s	344	73	8,675
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0	0ms	0	0	0
GLM 5 Turbo	6.1	3.1	66.7%	1	10.05s	477	60	2,216

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	31.93s	699	101	7,704
Qwen3.6 Plus Preview	6.5	10.0	50.0%	3.40s	381	27	1,383
GLM 5 Turbo	10.0	10.0	100.0%	5.38s	636	255	2,183

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0	32.50s	696	301	13,853
Qwen3.6 Plus Preview	5.3	10.0	33.3%	0	7.52s	183	27	2,998
GLM 5 Turbo	8.7	7.9	77.8%	1	5.23s	609	312	2,647

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	7.54s	8,193	309	909
Qwen3.6 Plus Preview	10.0	10.0	100.0%	5.87s	8,193	267	1,330
GLM 5 Turbo	10.0	10.0	100.0%	9.84s	6,879	241	446

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	103.81s	204	24	17,130
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0ms	0	0	0
GLM 5 Turbo	3.0	10.0	0.0%	40.17s	186	20	1,319

Быстрое сравнение

Сменить пару сравнения