Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Ring 2.6 1t

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика Seed-2.0-Mini Seed-2.0-Mini medium Релиз: 2026-02-14 Ring 2.6 1t Ring 2.6 1t none Релиз: 2026-05-10 Бесплатно доступно
Оценка 7.2 7.2
Ранг #58 #57
Надежность 3.3 9.8
Стабильность 9.2 9.1
Тестов верно
Доля успешных попыток 63.2% 62.5%
Нестабильные тесты 2 2
Всего запусков 57 57
Стоимость за результат 0.339 0.000
Общая стоимость $0.038 $0.000
???? ????? $0.100 / 1M $0.000 / 1M
???? ?????? $0.400 / 1M $0.000 / 1M
Выходные токены 2,469 39,954
Токены рассуждений 81,017 0
Время ответа (среднее) 68.89s 55.10s
Время ответа (макс.) 262.83s 143.82s
Время ответа (суммарно) 1102.23s 881.55s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Ring 2.6 1t 9.2 8.4 91.7% 1 43.33s 5,575 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Ring 2.6 1t 10.0 10.0 100.0% 0 143.82s 5,036 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Ring 2.6 1t 0.0 0.0 0.0% 0 0ms 0 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Ring 2.6 1t 3.0 10.0 0.0% 0 45.87s 1,529 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Ring 2.6 1t 5.3 7.2 44.4% 1 73.40s 17,728 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Ring 2.6 1t 4.3 10.0 0.0% 0 15.63s 846 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Ring 2.6 1t 9.8 10.0 100.0% 0 27.36s 2,004 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Ring 2.6 1t 7.7 10.0 66.7% 0 31.47s 3,469 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Ring 2.6 1t 0.0 0.0 0.0% 0 0ms 0 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Ring 2.6 1t 3.0 10.0 0.0% 0 133.60s 3,767 0

Быстрое сравнение

Сменить пару сравнения