Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs OpenAI: gpt-oss-120b

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Ring-2.6-1T Ring-2.6-1T none Релиз: 2026-05-10 gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05 Бесплатно доступно
Оценка 6.2 6.1
Ранг #96 #99
Надежность 10.0 10.0
Стабильность 9.3 8.0
Тестов верно
Доля успешных попыток 47.6% 52.4%
Нестабильные тесты 2 5
Всего запусков 63 63
Стоимость за результат 0.000 0.141
Общая стоимость $0.026 $0.013
Цена входа $0.075 / 1M $0.039 / 1M
Цена выхода $0.625 / 1M $0.180 / 1M
Общее число входных токенов 7,599 39,084
Выходные токены 39,954 20,013
Токены рассуждений 0 50,233
Время ответа (среднее) 55.10s 22.28s
Время ответа (макс.) 143.82s 68.16s
Время ответа (суммарно) 881.55s 311.96s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 810 5,575 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 5.3 10.0 33.3% 0 143.82s 834 5,036 0
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 3.0 10.0 0.0% 0 0ms 0 0 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 2,712 1,529 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 873 17,728 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 561 846 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 774 2,004 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 792 3,469 0
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 3.0 10.0 0.0% 0 0ms 0 0 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 243 3,767 0
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

Быстрое сравнение

Сменить пару сравнения