AI BENCHY Compare

Trinity Large Preview vs Elephant Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27	Elephant Alpha Elephant Alpha medium Релиз: 2026-04-14

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27	Elephant Alpha Elephant Alpha medium Релиз: 2026-04-14
Оценка	4.7	5.3
Ранг	#148	#134
Надежность	10.0	Н/Д
Стабильность	9.3	9.7
Тестов верно
Доля успешных попыток	23.3%	31.7%
Нестабильные тесты	2	1
Всего запусков	60	60
Стоимость за результат	0.017	0.000
Общая стоимость	$0.008	$0.000
Цена входа	$0.243 / 1M	$0.000 / 1M
Цена выхода	$0.243 / 1M	$0.000 / 1M
Общее число входных токенов	29,828	33,744
Выходные токены	2,169	2,596
Токены рассуждений	0	0
Время ответа (среднее)	2.98s	1.27s
Время ответа (макс.)	14.34s	3.70s
Время ответа (суммарно)	56.57s	22.82s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	726	815	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	6.6	16.7%	1		14.34s	738	397	0
Elephant Alpha	4.0	6.7	16.7%	1		1.30s	813	365	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	12,053	294	0
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	14,046	562	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
Elephant Alpha	6.5	10.0	50.0%	0		979ms	8,004	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
Elephant Alpha	3.0	10.0	0.0%	0		925ms	810	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
Elephant Alpha	4.3	10.0	0.0%	0		920ms	540	105	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
Elephant Alpha	9.8	10.0	100.0%	0		987ms	732	82	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
Elephant Alpha	5.3	10.0	33.3%	0		868ms	729	166	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	7,344	231	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
Elephant Alpha	3.0	10.0	0.0%	0		0ms	0	0	0

Быстрое сравнение

Сменить пару сравнения

Trinity Large PreviewnonevsQwen3 Coder Nextmedium Kimi K2.5nonevsElephant Alphamedium Elephant AlphamediumvsGLM 5 Turbonone Ling-2.6-flashnonevsElephant Alphamedium Elephant AlphamediumvsQwen3.5-122B-A10Bnone DeepSeek V3.2nonevsElephant Alphamedium Elephant AlphamediumvsGrok 4.20none gpt-oss-120bnoneБесплатно доступноvsElephant Alphamedium DeepSeek V4 FlashnonevsElephant Alphamedium Elephant AlphamediumvsQwen3 Coder Nextnone Trinity Large PreviewnonevsGLM 4.7 Flashmedium Elephant AlphamediumvsQwen3.6 Flashnone