Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Trinity Large Preview vs Z.ai: GLM 4.7 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 GLM 4.7 Flash GLM 4.7 Flash medium Релиз: 2026-01-19
Оценка 4.7 4.5
Ранг #148 #155
Надежность 10.0 10.0
Стабильность 9.3 6.7
Тестов верно
Доля успешных попыток 23.3% 35.0%
Нестабильные тесты 2 8
Всего запусков 60 60
Стоимость за результат 0.017 1.337
Общая стоимость $0.008 $0.054
Цена входа $0.243 / 1M $0.060 / 1M
Цена выхода $0.243 / 1M $0.400 / 1M
Общее число входных токенов 29,828 37,206
Выходные токены 2,169 43,754
Токены рассуждений 0 89,079
Время ответа (среднее) 2.98s 35.10s
Время ответа (макс.) 14.34s 174.55s
Время ответа (суммарно) 56.57s 456.24s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 651 550 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 4.0 6.6 16.7% 1 14.34s 738 397 0
GLM 4.7 Flash 3.4 6.0 16.7% 1 55.33s 3,106 4,981 22,387
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 12,053 294 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 6,900 186 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 738 25 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 498 104 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.5 10.0 0.0% 0 822ms 678 63 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.6 7.7 11.1% 1 1.97s 669 265 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 6,699 267 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 204 18 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

Быстрое сравнение

Сменить пару сравнения