Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Arcee AI: Trinity Large Preview vs Qwen: Qwen3 Coder Next

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 Qwen3 Coder Next Qwen3 Coder Next none Релиз: 2026-02-03
Оценка 5.3 5.1
Ранг #102 #113
Надежность Н/Д Н/Д
Стабильность 9.6 9.7
Тестов верно
Доля успешных попыток 29.6% 25.9%
Нестабильные тесты 1 1
Всего запусков 52 54
Стоимость за результат 0.000 0.188
Общая стоимость $0.000 $0.008
???? ????? $0.150 / 1M $0.140 / 1M
???? ?????? $0.450 / 1M $0.800 / 1M
Выходные токены 1,985 3,617
Токены рассуждений 0 0
Время ответа (среднее) 5.07s 10.18s
Время ответа (макс.) 39.47s 45.14s
Время ответа (суммарно) 91.23s 122.13s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
Qwen3 Coder Next 3.6 10.0 0.0% 0 3.31s 1,321 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
Qwen3 Coder Next 7.3 3.7 66.7% 1 3.14s 585 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 45.14s 317 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
Qwen3 Coder Next 6.5 10.0 50.0% 0 1.32s 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
Qwen3 Coder Next 5.3 10.0 33.3% 0 962ms 26 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 1.34s 152 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
Qwen3 Coder Next 4.8 10.0 0.0% 0 7.71s 63 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
Qwen3 Coder Next 3.2 10.0 0.0% 0 22.86s 652 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 2.47s 255 0

Быстрое сравнение

Сменить пару сравнения