Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs MiniMax: MiniMax M2.7

Сводка

Сравнение benchmark Seed-2.0-Lite vs MiniMax M2.7: Seed-2.0-Lite лидирует по среднему баллу: 5.8 vs 5.3. Seed-2.0-Lite имеет более низкую стоимость benchmark: $0.019 vs $0.124. Seed-2.0-Lite быстрее: 2.49s vs 38.18s, с долей успешных попыток 46.0% vs 46.0%.

Рекомендуемая модель: Seed-2.0-Lite - Здесь у него лучший балл (5.8), при этом он примерно в 6.8 раза дешевле, чем MiniMax M2.7.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14 MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18
Оценка 5.8 5.3
Ранг #110 #130
Надежность 10.0 10.0
Стабильность 8.4 6.8
Тестов верно
Доля успешных попыток 46.0% 46.0%
Нестабильные тесты 4 8
Всего запусков 63 63
Стоимость за результат 0.228 2.494
Общая стоимость $0.019 $0.124
Цена входа $0.250 / 1M $0.279 / 1M
Цена выхода $2.000 / 1M $1.200 / 1M
Общее число входных токенов 46,573 34,371
Выходные токены 3,259 8,981
Токены рассуждений 0 89,812
Время ответа (среднее) 2.49s 38.18s
Время ответа (макс.) 6.70s 196.21s
Время ответа (суммарно) 52.26s 763.60s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#110 Seed-2.0-Lite

none
Cost
$0.005
Time
83.8s
Tokens
2,311 tok

#130 MiniMax M2.7

medium
Cost
$0.022
Time
22.8s
Tokens
9,250 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 894 709 0
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 5.6 10.0 33.3% 0 2.83s 8,215 410 0
MiniMax M2.7 5.7 9.1 33.3% 0 101.89s 2,961 1,231 38,841
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 16,215 498 0
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 8,538 246 0
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 939 17 0
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 570 294 0
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 810 73 0
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 5.3 7.2 44.4% 1 2.78s 858 709 0
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 9,270 292 0
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Seed-2.0-Lite 3.0 10.0 0.0% 0 1.96s 264 11 0
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452

Быстрое сравнение

Сменить пару сравнения