Сравнить Графики Методология

Язык:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs OpenAI: GPT-5.2

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-06

Метрика	Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	OpenAI: GPT-5.2 medium Релиз: 2025-12-11
Ранг	#45	#27
Средний балл	4.2	6.5
Стабильность	9.6	7.9
Стоимость за результат	0.000	3.125
Общая стоимость	$0.000	$0.313
Тестов верно
Доля успешных попыток	33.3%	75.0%
Нестабильные тесты	1	4
Всего запусков	48	48
Выходные токены	1,837	2,220
Токены рассуждений	0	16,811
Время ответа (среднее)	3.15s	15.33s
Время ответа (макс.)	8.91s	77.80s
Время ответа (суммарно)	50.46s	138.01s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
OpenAI: GPT-5.2	7.0	7.3	77.8%	1		14.34s	549	2,002

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
OpenAI: GPT-5.2	10.0	10.0	100.0%	0		14.06s	291	1,757

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
OpenAI: GPT-5.2	9.9	10.0	100.0%	0		3.15s	234	420

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
OpenAI: GPT-5.2	4.0	7.2	55.6%	1		77.80s	42	10,342

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
OpenAI: GPT-5.2	10.0	9.7	0.0%	0		4.32s	162	269

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
OpenAI: GPT-5.2	9.5	10.0	100.0%	0		3.12s	94	614

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
OpenAI: GPT-5.2	7.0	7.3	77.8%	1		5.47s	609	938

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
OpenAI: GPT-5.2	10.0	1.6	66.7%	1		10.30s	239	469

Быстрое сравнение

Сменить пару сравнения

Claude Sonnet 4.6nonevsGPT-5.2medium GPT-5.2mediumvsQwen3.5 Plus 2026-02-15none Trinity Large PreviewnoneБесплатно доступноvsMiniMax M2.5medium GPT-5.2mediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Trinity Large PreviewnoneБесплатно доступноvsQwen3 Coder Nextmedium Gemini 3 Flash PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2medium Trinity Large PreviewnoneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступно DeepSeek V3.2nonevsGPT-5.2medium Trinity Large PreviewnoneБесплатно доступноvsMercury 2medium Trinity Large PreviewnoneБесплатно доступноvsGLM 4.7 Flashmedium