Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs Laguna M.1

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Ring-2.6-1T Ring-2.6-1T medium Релиз: 2026-05-10 Laguna M.1 Laguna M.1 none Релиз: 2026-04-28 Бесплатно доступно
Оценка 7.2 5.4
Ранг #61 #123
Надежность 9.9 9.8
Стабильность 8.7 8.5
Тестов верно
Доля успешных попыток 66.7% 40.0%
Нестабильные тесты 3 3
Всего запусков 60 57
Стоимость за результат 0.000 0.000
Общая стоимость $0.000 $0.000
???? ????? $0.075 / 1M $0.000 / 1M
???? ?????? $0.625 / 1M $0.000 / 1M
Выходные токены 21,752 2,068
Токены рассуждений 42,754 0
Время ответа (среднее) 61.29s 2.89s
Время ответа (макс.) 304.19s 15.42s
Время ответа (суммарно) 1164.50s 43.40s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 3,833 4,891
Laguna M.1 3.6 7.2 22.2% 1 705ms 34 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 59.65s 1,369 3,985
Laguna M.1 7.5 3.8 66.7% 1 2.93s 543 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 324 6,088
Laguna M.1 3.0 10.0 0.0% 0 4.32s 622 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 840 1,937
Laguna M.1 10.0 10.0 100.0% 0 3.37s 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 9,744 15,013
Laguna M.1 3.6 7.2 22.2% 1 5.50s 33 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 150 583
Laguna M.1 0.0 0.0 0.0% 0 0ms 0 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 266 1,831
Laguna M.1 6.3 10.0 50.0% 0 683ms 80 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 697 2,479
Laguna M.1 3.0 10.0 0.0% 0 948ms 201 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 234 1,531
Laguna M.1 10.0 10.0 100.0% 0 7.54s 309 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 4,295 4,416
Laguna M.1 0.0 0.0 0.0% 0 0ms 0 0

Быстрое сравнение

Сменить пару сравнения