AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs OpenAI: GPT-5 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика	Ring-2.6-1T Ring-2.6-1T medium Релиз: 2026-05-10	GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07

Метрика	Ring-2.6-1T Ring-2.6-1T medium Релиз: 2026-05-10	GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07
Оценка	7.2	7.2
Ранг	#69	#73
Надежность	10.0	10.0
Стабильность	8.7	9.1
Тестов верно
Доля успешных попыток	66.7%	61.7%
Нестабильные тесты	3	2
Всего запусков	60	60
Стоимость за результат	0.000	1.348
Общая стоимость	$0.132	$0.149
Цена входа	$0.300 / 1M	$0.250 / 1M
Цена выхода	$2.500 / 1M	$2.000 / 1M
Выходные токены	21,752	6,723
Токены рассуждений	42,754	63,082
Время ответа (среднее)	61.29s	23.75s
Время ответа (макс.)	304.19s	88.15s
Время ответа (суммарно)	1164.50s	475.03s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	10.0	10.0	100.0%	0		42.21s	3,833	4,891
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	1,715	6,378

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	10.0	10.0	100.0%	0		59.65s	1,369	3,985
GPT-5 Mini	10.0	10.0	100.0%	0		30.74s	580	12,544

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	10.0	10.0	100.0%	0		304.19s	324	6,088
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	6.5	10.0	50.0%	0		37.36s	840	1,937
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	453	3,200

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	3.5	4.4	33.3%	2		64.92s	9,744	15,013
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	293	14,016

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	4.1	10.0	0.0%	0		58.26s	150	583
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	349	1,856

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	9.8	10.0	100.0%	0		11.78s	266	1,831
GPT-5 Mini	10.0	10.0	100.0%	0		11.59s	310	3,968

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	5.9	7.2	55.6%	1		20.73s	697	2,479
GPT-5 Mini	5.6	9.8	33.3%	0		15.20s	1,622	6,144

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	10.0	10.0	100.0%	0		104.44s	234	1,531
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ring-2.6-1T	3.0	10.0	0.0%	0		113.91s	4,295	4,416
GPT-5 Mini	3.0	10.0	0.0%	0		9.99s	160	1,856

Быстрое сравнение

Сменить пару сравнения

Claude Opus 4.8nonevsRing-2.6-1Tmedium GPT-5 MinimediumvsStep 3.7 Flashhigh Ring-2.6-1TnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.6 Max Previewnone Claude Opus 4.8nonevsGPT-5 Minimedium Ring-2.6-1TmediumvsStep 3.7 Flashhigh Claude Sonnet 4.6nonevsGPT-5 Minimedium Ring-2.6-1TmediumvsStep 3.7 Flashlow Ring-2.6-1TmediumvsQwen3.6 Max Previewnone Ring-2.6-1TmediumvsGPT-5.3 Chatnone Gemini 3.1 Flash LitelowvsRing-2.6-1Tmedium Claude Sonnet 4.6nonevsRing-2.6-1Tmedium