Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Arcee AI: Trinity Large Preview vs OpenAI: GPT-5.4 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 GPT-5.4 Mini GPT-5.4 Mini none Релиз: 2026-03-17
Оценка 5.3 5.1
Ранг #102 #112
Надежность Н/Д Н/Д
Стабильность 9.6 8.6
Тестов верно
Доля успешных попыток 29.6% 35.2%
Нестабильные тесты 1 3
Всего запусков 52 54
Стоимость за результат 0.000 0.630
Общая стоимость $0.000 $0.032
???? ????? $0.150 / 1M $0.750 / 1M
???? ?????? $0.450 / 1M $4.500 / 1M
Выходные токены 1,985 2,418
Токены рассуждений 0 0
Время ответа (среднее) 5.07s 1.17s
Время ответа (макс.) 39.47s 2.52s
Время ответа (суммарно) 91.23s 21.01s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0

Быстрое сравнение

Сменить пару сравнения