Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Trinity Large Preview vs Elephant Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 Elephant Alpha Elephant Alpha medium Релиз: 2026-04-14
Оценка 4.7 5.3
Ранг #148 #134
Надежность 10.0 Н/Д
Стабильность 9.3 9.7
Тестов верно
Доля успешных попыток 23.3% 31.7%
Нестабильные тесты 2 1
Всего запусков 60 60
Стоимость за результат 0.017 0.000
Общая стоимость $0.008 $0.000
Цена входа $0.243 / 1M $0.000 / 1M
Цена выхода $0.243 / 1M $0.000 / 1M
Общее число входных токенов 29,828 33,744
Выходные токены 2,169 2,596
Токены рассуждений 0 0
Время ответа (среднее) 2.98s 1.27s
Время ответа (макс.) 14.34s 3.70s
Время ответа (суммарно) 56.57s 22.82s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 651 550 0
Elephant Alpha 6.6 10.0 50.0% 0 1.19s 726 815 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 4.0 6.6 16.7% 1 14.34s 738 397 0
Elephant Alpha 4.0 6.7 16.7% 1 1.30s 813 365 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 12,053 294 0
Elephant Alpha 3.0 10.0 0.0% 0 3.70s 14,046 562 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 6,900 186 0
Elephant Alpha 6.5 10.0 50.0% 0 979ms 8,004 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 738 25 0
Elephant Alpha 3.0 10.0 0.0% 0 925ms 810 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 498 104 0
Elephant Alpha 4.3 10.0 0.0% 0 920ms 540 105 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.5 10.0 0.0% 0 822ms 678 63 0
Elephant Alpha 9.8 10.0 100.0% 0 987ms 732 82 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.6 7.7 11.1% 1 1.97s 669 265 0
Elephant Alpha 5.3 10.0 33.3% 0 868ms 729 166 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 6,699 267 0
Elephant Alpha 3.0 10.0 0.0% 0 2.83s 7,344 231 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 204 18 0
Elephant Alpha 3.0 10.0 0.0% 0 0ms 0 0 0

Быстрое сравнение

Сменить пару сравнения