Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Mistral: Mistral Small 4 vs Z.ai: GLM 5 Turbo

Сводка

Сравнение benchmark Mistral Small 4 vs GLM 5 Turbo: GLM 5 Turbo лидирует по среднему баллу: 5.3 vs 5.1. GLM 5 Turbo имеет более низкую стоимость benchmark: $0.047 vs $0.068. GLM 5 Turbo быстрее: 2.82s vs 9.40s, с долей успешных попыток 44.4% vs 31.8%.

Рекомендуемая модель: GLM 5 Turbo - Здесь у него лучший балл (5.3), и он отвечает примерно в 3.3 раза быстрее, чем Mistral Small 4.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16 GLM 5 Turbo GLM 5 Turbo none Релиз: 2026-03-15
Оценка 5.1 5.3
Ранг #138 #128
Надежность 10.0 10.0
Стабильность 6.9 9.3
Тестов верно
Доля успешных попыток 44.4% 31.8%
Нестабильные тесты 8 2
Всего запусков 63 63
Стоимость за результат 1.344 0.655
Общая стоимость $0.068 $0.047
Цена входа $0.150 / 1M $1.200 / 1M
Цена выхода $0.600 / 1M $4.000 / 1M
Общее число входных токенов 42,576 32,525
Выходные токены 24,184 1,815
Токены рассуждений 84,678 0
Время ответа (среднее) 9.40s 2.82s
Время ответа (макс.) 59.15s 8.21s
Время ответа (суммарно) 197.39s 59.29s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Mistral Small 4

medium
Cost
$0.006
Time
47.9s
Tokens
9,857 tok

#128 GLM 5 Turbo

none
Cost
$0.047
Time
129.2s
Tokens
11,775 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 708 4,055 4,778
GLM 5 Turbo 3.0 10.0 0.0% 0 2.84s 555 382 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 4.4 5.1 33.3% 2 39.98s 7,636 11,635 54,715
GLM 5 Turbo 3.9 7.8 11.1% 1 2.41s 7,256 529 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 18,706 2,612 10,700
GLM 5 Turbo 3.0 10.0 0.0% 0 4.89s 8,133 144 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 6,171 335 723
GLM 5 Turbo 10.0 10.0 100.0% 0 2.47s 7,107 204 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 742 2,621 6,904
GLM 5 Turbo 5.3 10.0 33.3% 0 1.97s 687 25 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 519 821 828
GLM 5 Turbo 4.2 9.9 0.0% 0 2.18s 477 48 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 729 540 1,031
GLM 5 Turbo 6.5 10.0 50.0% 0 2.13s 636 65 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 3.4 9.7 0.0% 0 2.17s 735 1,226 2,632
GLM 5 Turbo 5.5 7.4 44.4% 1 2.65s 609 180 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 6,420 321 810
GLM 5 Turbo 10.0 10.0 100.0% 0 8.21s 6,879 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 210 18 1,557
GLM 5 Turbo 3.0 10.0 0.0% 0 2.37s 186 16 0

Быстрое сравнение

Сменить пару сравнения