Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Xiaomi: MiMo-V2-Omni

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-26

Метрика Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14 MiMo-V2-Omni MiMo-V2-Omni none Релиз: 2026-03-18
Оценка 6.2 6.5
Ранг #72 #66
Надежность Н/Д Н/Д
Стабильность 7.7 10.0
Тестов верно
Доля успешных попыток 55.6% 44.4%
Нестабильные тесты 5 0
Всего запусков 54 20
Стоимость за результат 0.200 0.083
Общая стоимость $0.016 $0.007
???? ????? $0.250 / 1M $0.400 / 1M
???? ?????? $2.000 / 1M $2.000 / 1M
Выходные токены 3,129 868
Токены рассуждений 0 0
Время ответа (среднее) 2.53s 1.99s
Время ответа (макс.) 6.70s 6.81s
Время ответа (суммарно) 45.46s 35.81s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
MiMo-V2-Omni 4.8 10.0 25.0% 0 1.10s 74 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
MiMo-V2-Omni 6.6 10.0 0.0% 0 1.72s 399 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 2.47s 110 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 1.69s 83 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
MiMo-V2-Omni 5.3 10.0 33.3% 0 1.14s 8 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
MiMo-V2-Omni 4.5 10.0 0.0% 0 1.19s 37 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
MiMo-V2-Omni 6.5 10.0 50.0% 0 4.18s 22 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
MiMo-V2-Omni 8.0 10.0 66.7% 0 2.71s 58 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.76s 77 0

Быстрое сравнение

Сменить пару сравнения