Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V3.2

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14 DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01
Оценка 5.9 5.6
Ранг #106 #120
Надежность 10.0 10.0
Стабильность 8.3 8.3
Тестов верно
Доля успешных попыток 48.3% 41.7%
Нестабильные тесты 4 6
Всего запусков 60 60
Стоимость за результат 0.218 0.222
Общая стоимость $0.018 $0.018
Цена входа $0.250 / 1M $0.252 / 1M
Цена выхода $2.000 / 1M $0.378 / 1M
Выходные токены 3,253 11,159
Токены рассуждений 0 0
Время ответа (среднее) 2.48s 14.43s
Время ответа (макс.) 6.70s 115.89s
Время ответа (суммарно) 49.67s 288.55s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
DeepSeek V3.2 3.2 8.2 8.3% 1 9.35s 1,073 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 6.8 9.9 50.0% 0 2.95s 404 0
DeepSeek V3.2 3.1 5.4 16.7% 1 20.87s 4,522 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
DeepSeek V3.2 2.9 6.9 11.1% 1 4.17s 21 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
DeepSeek V3.2 6.8 10.0 66.7% 1 9.32s 43 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 5.3 7.2 44.4% 1 2.78s 709 0
DeepSeek V3.2 8.3 10.0 77.8% 1 6.91s 298 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 10.0 0.0% 0 1.96s 11 0
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 17 0

Быстрое сравнение

Сменить пару сравнения