Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Cobuddy vs ByteDance Seed: Seed-2.0-Lite

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Cobuddy Cobuddy medium Релиз: 2026-05-06 Бесплатно доступно Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14
Оценка 5.8 6.0
Ранг #102 #93
Надежность 9.9 10.0
Стабильность 6.9 7.8
Тестов верно
Доля успешных попыток 54.4% 52.6%
Нестабильные тесты 7 5
Всего запусков 57 57
Стоимость за результат 0.000 0.202
Общая стоимость $0.000 $0.017
???? ????? $0.000 / 1M $0.250 / 1M
???? ?????? $0.000 / 1M $2.000 / 1M
Выходные токены 1,648 3,140
Токены рассуждений 96,062 0
Время ответа (среднее) 36.50s 2.50s
Время ответа (макс.) 309.02s 6.70s
Время ответа (суммарно) 693.45s 47.42s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 8.7 7.9 91.7% 1 10.00s 98 4,666
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 4.3 1.1 66.7% 1 53.59s 343 9,678
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 3.0 10.0 0.0% 0 47.38s 465 7,265
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 6.3 5.8 66.7% 1 17.36s 275 5,591
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 2.9 4.4 22.2% 2 128.15s 10 49,454
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 4.2 9.9 0.0% 0 23.23s 76 3,782
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 9.8 10.0 100.0% 0 11.60s 64 2,842
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 3.5 4.4 33.3% 2 12.91s 175 5,627
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 10.0 10.0 100.0% 0 11.19s 133 294
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 3.0 10.0 0.0% 0 36.98s 9 6,863
Seed-2.0-Lite 3.0 10.0 0.0% 0 1.96s 11 0

Быстрое сравнение

Сменить пару сравнения