Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Z.ai: GLM 5V Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика Claude Sonnet 4.6 Claude Sonnet 4.6 none Релиз: 2026-02-17 GLM 5V Turbo GLM 5V Turbo medium Релиз: 2026-04-01
Оценка 7.2 7.5
Ранг #63 #49
Надежность 10.0 10.0
Стабильность 9.6 7.6
Тестов верно
Доля успешных попыток 61.4% 73.7%
Нестабильные тесты 1 6
Всего запусков 57 57
Стоимость за результат 2.441 2.919
Общая стоимость $0.269 $0.322
???? ????? $3.000 / 1M $1.200 / 1M
???? ?????? $15.000 / 1M $4.000 / 1M
Выходные токены 7,864 2,373
Токены рассуждений 0 66,463
Время ответа (среднее) 4.96s 16.33s
Время ответа (макс.) 23.84s 67.08s
Время ответа (суммарно) 59.50s 310.29s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
GLM 5V Turbo 7.2 6.1 75.0% 2 10.76s 587 7,872
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
GLM 5V Turbo 10.0 10.0 100.0% 0 13.78s 404 4,628
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
GLM 5V Turbo 6.9 3.8 66.7% 1 15.06s 403 2,523
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
GLM 5V Turbo 10.0 10.0 100.0% 0 9.60s 236 4,333
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
GLM 5V Turbo 5.3 7.2 44.4% 1 38.15s 32 29,035
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
GLM 5V Turbo 10.0 10.0 100.0% 0 11.09s 131 2,183
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
GLM 5V Turbo 9.9 10.0 100.0% 0 3.74s 72 1,813
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
GLM 5V Turbo 7.6 7.2 77.8% 1 10.91s 193 5,789
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
GLM 5V Turbo 7.0 3.7 66.7% 1 12.53s 293 765
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 431 0
GLM 5V Turbo 3.0 10.0 0.0% 0 40.96s 22 7,522

Быстрое сравнение

Сменить пару сравнения