Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs OpenAI: gpt-oss-120b

Сводка

Сравнение benchmark Ring-2.6-1T vs gpt-oss-120b: Ring-2.6-1T лидирует по среднему баллу: 6.8 vs 6.7. gpt-oss-120b имеет более низкую стоимость benchmark: $0.011 vs $0.033. gpt-oss-120b быстрее: 22.28s vs 61.29s, с долей успешных попыток 60.3% vs 52.4%.

Рекомендуемая модель: gpt-oss-120b - Его балл близок к лучшему здесь (6.7 против 6.8), при этом он примерно в 3.3 раза дешевле, чем Ring-2.6-1T.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика Ring-2.6-1T Ring-2.6-1T medium Релиз: 2026-05-10 gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05 Бесплатно доступно
Оценка 6.8 6.7
Ранг #75 #81
Надежность 10.0 10.0
Стабильность 8.8 8.0
Тестов верно
Доля успешных попыток 60.3% 52.4%
Нестабильные тесты 3 5
Всего запусков 63 63
Стоимость за результат 0.000 0.141
Общая стоимость $0.033 $0.011
Цена входа $0.075 / 1M $0.030 / 1M
Цена выхода $0.625 / 1M $0.150 / 1M
Общее число входных токенов 35,892 39,084
Выходные токены 21,752 20,013
Токены рассуждений 42,754 50,233
Время ответа (среднее) 61.29s 22.28s
Время ответа (макс.) 304.19s 68.16s
Время ответа (суммарно) 1164.50s 311.96s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#75 Ring-2.6-1T

medium
Ring-2.6-1T is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ring-2.6-1t
Стоимость
$0.000
Время
0.1s
Токены
0 tok

#81 gpt-oss-120b

medium
Стоимость
$0.001
Время
26.7s
Токены
555 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 810 3,833 4,891
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 5.3 10.0 33.3% 0 59.65s 834 1,369 3,985
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 14,823 324 6,088
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 8,046 840 1,937
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 873 9,744 15,013
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 561 150 583
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 774 266 1,831
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 792 697 2,479
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 8,136 234 1,531
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 243 4,295 4,416
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

Быстрое сравнение

Сменить пару сравнения