Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 2.5 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-16

Метрика Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14 Gemini 2.5 Flash Gemini 2.5 Flash medium Релиз: 2025-06-17
Оценка 6.2 8.2
Ранг #60 #15
Стабильность 7.7 9.5
Тестов верно
Доля успешных попыток 55.6% 75.9%
Нестабильные тесты 5 1
Всего запусков 54 54
Стоимость за результат 0.200 2.454
Общая стоимость $0.016 $0.319
???? ????? $0.250 / 1M $0.300 / 1M
???? ?????? $2.000 / 1M $2.500 / 1M
Выходные токены 3,129 1,898
Токены рассуждений 0 122,273
Время ответа (среднее) 2.53s 12.12s
Время ответа (макс.) 6.70s 95.48s
Время ответа (суммарно) 45.46s 218.12s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 16.23s 522 10,350
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.94s 126 2,499
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140

Быстрое сравнение

Сменить пару сравнения