Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs OpenAI: GPT-5.4

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика Ring-2.6-1T Ring-2.6-1T medium Релиз: 2026-05-10 GPT-5.4 GPT-5.4 none Релиз: 2026-03-05
Оценка 7.0 5.6
Ранг #74 #121
Надежность 10.0 10.0
Стабильность 8.7 9.1
Тестов верно
Доля успешных попыток 63.3% 38.3%
Нестабильные тесты 3 2
Всего запусков 60 60
Стоимость за результат 0.000 1.644
Общая стоимость $0.033 $0.116
Цена входа $0.075 / 1M $2.500 / 1M
Цена выхода $0.625 / 1M $15.000 / 1M
Общее число входных токенов 35,892 31,593
Выходные токены 21,752 2,402
Токены рассуждений 42,754 0
Время ответа (среднее) 61.29s 1.45s
Время ответа (макс.) 304.19s 2.95s
Время ответа (суммарно) 1164.50s 29.00s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 810 3,833 4,891
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 6.5 10.0 50.0% 0 59.65s 834 1,369 3,985
GPT-5.4 6.8 10.0 50.0% 0 1.99s 4,686 501 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 14,823 324 6,088
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 8,046 840 1,937
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 873 9,744 15,013
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 561 150 583
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 774 266 1,831
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 792 697 2,479
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 8,136 234 1,531
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 243 4,295 4,416
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0

Быстрое сравнение

Сменить пару сравнения