AI BENCHY Compare

Trinity Large Preview vs OpenAI: gpt-oss-120b

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27	gpt-oss-120b gpt-oss-120b none Релиз: 2025-08-05 Бесплатно доступно

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27	gpt-oss-120b gpt-oss-120b none Релиз: 2025-08-05 Бесплатно доступно
Оценка	4.7	5.4
Ранг	#148	#126
Надежность	10.0	10.0
Стабильность	9.3	9.1
Тестов верно
Доля успешных попыток	23.3%	38.6%
Нестабильные тесты	2	2
Всего запусков	60	57
Стоимость за результат	0.017	0.168
Общая стоимость	$0.008	$0.010
Цена входа	$0.243 / 1M	$0.039 / 1M
Цена выхода	$0.243 / 1M	$0.180 / 1M
Общее число входных токенов	29,828	9,081
Выходные токены	2,169	51,664
Токены рассуждений	0	0
Время ответа (среднее)	2.98s	21.61s
Время ответа (макс.)	14.34s	113.71s
Время ответа (суммарно)	56.57s	345.79s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	1,336	8,676	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	6.6	16.7%	1		14.34s	738	397	0
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	901	3,232	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	12,053	294	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	2,421	598	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	1,294	29,483	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	584	615	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	1,043	1,940	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	1,188	3,982	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	314	3,138	0

Быстрое сравнение

Сменить пару сравнения

Trinity Large PreviewnonevsQwen3 Coder Nextmedium MiniMax M2.5mediumvsgpt-oss-120bnoneБесплатно доступно MiniMax M2.7mediumvsgpt-oss-120bnoneБесплатно доступно Mistral Small 4mediumvsgpt-oss-120bnoneБесплатно доступно gpt-oss-120bnoneБесплатно доступноvsElephant Alphamedium Trinity Large PreviewnonevsGLM 4.7 Flashmedium Cobuddymediumvsgpt-oss-120bnoneБесплатно доступно gpt-oss-120bnoneБесплатно доступноvsOwl Alphamedium Trinity Large PreviewnonevsQwen3.5-9Bmedium Nemotron 3 SupermediumБесплатно доступноvsgpt-oss-120bnoneБесплатно доступно Trinity Large PreviewnonevsElephant Alphamedium DeepSeek V4 Prohighvsgpt-oss-120bnoneБесплатно доступно