Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V3.2

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-16

Метрика Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14 DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01
Оценка 6.2 6.1
Ранг #60 #63
Стабильность 7.7 8.1
Тестов верно
Доля успешных попыток 55.6% 50.0%
Нестабильные тесты 5 4
Всего запусков 54 54
Стоимость за результат 0.200 0.226
Общая стоимость $0.016 $0.016
???? ????? $0.250 / 1M $0.260 / 1M
???? ?????? $2.000 / 1M $0.380 / 1M
Выходные токены 3,129 8,384
Токены рассуждений 0 0
Время ответа (среднее) 2.53s 12.09s
Время ответа (макс.) 6.70s 115.89s
Время ответа (суммарно) 45.46s 217.56s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
DeepSeek V3.2 2.4 1.3 33.3% 1 7.63s 553 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0

Быстрое сравнение

Сменить пару сравнения