AI BENCHY Compare

Arcee AI: Trinity Large Preview vs OpenAI: GPT-5.4 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27	GPT-5.4 Mini GPT-5.4 Mini none Релиз: 2026-03-17

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27	GPT-5.4 Mini GPT-5.4 Mini none Релиз: 2026-03-17
Оценка	5.3	5.1
Ранг	#102	#112
Надежность	Н/Д	Н/Д
Стабильность	9.6	8.6
Тестов верно
Доля успешных попыток	29.6%	35.2%
Нестабильные тесты	1	3
Всего запусков	52	54
Стоимость за результат	0.000	0.630
Общая стоимость	$0.000	$0.032
???? ?????	$0.150 / 1M	$0.750 / 1M
???? ??????	$0.450 / 1M	$4.500 / 1M
Выходные токены	1,985	2,418
Токены рассуждений	0	0
Время ответа (среднее)	5.07s	1.17s
Время ответа (макс.)	39.47s	2.52s
Время ответа (суммарно)	91.23s	21.01s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
GPT-5.4 Mini	3.1	8.1	8.3%	1		929ms	654	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		1.19s	333	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
GPT-5.4 Mini	3.0	10.0	0.0%	0		2.52s	298	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		1.30s	222	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
GPT-5.4 Mini	3.5	4.4	33.3%	2		937ms	88	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
GPT-5.4 Mini	4.8	10.0	0.0%	0		1.82s	174	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
GPT-5.4 Mini	6.3	10.0	50.0%	0		728ms	101	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
GPT-5.4 Mini	5.4	10.0	33.3%	0		860ms	293	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
GPT-5.4 Mini	3.0	10.0	0.0%	0		2.32s	255	0

Быстрое сравнение

Сменить пару сравнения

Trinity Large PreviewnonevsMiniMax M2.7medium Nemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступноvsGPT-5.4 Mininone Trinity Large PreviewnonevsElephant Alphamedium GPT-5.4 MininonevsElephant Alphamedium Trinity Large PreviewnonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступно MiniMax M2.7mediumvsGPT-5.4 Mininone Trinity Large PreviewnonevsMistral Small 4medium Trinity Large PreviewnonevsMiniMax M2.5mediumБесплатно доступно GPT-5.4 MininonevsQwen3 Coder Nextmedium Trinity Large Previewnonevsgpt-oss-120bmediumБесплатно доступно Mistral Small 4mediumvsGPT-5.4 Mininone GPT-5.4 MininonevsGLM 4.7 Flashmedium