Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

IBM: Granite 4.1 8B vs MiniMax: MiniMax M2.7

Сводка

Сравнение benchmark Granite 4.1 8B vs MiniMax M2.7: MiniMax M2.7 лидирует по среднему баллу: 5.2 vs 4.0. Granite 4.1 8B имеет более низкую стоимость benchmark: $0.003 vs $0.104. Granite 4.1 8B быстрее: 728ms vs 38.18s, с долей успешных попыток 9.5% vs 46.0%.

Рекомендуемая модель: Granite 4.1 8B - Он дает лучший общий компромисс: конкурентный балл (4.0), ниже стоимость, чем у MiniMax M2.7, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01 MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18
Оценка 4.0 5.2
Ранг #163 #134
Надежность 10.0 10.0
Стабильность 10.0 6.8
Тестов верно
Доля успешных попыток 9.5% 46.0%
Нестабильные тесты 0 8
Всего запусков 63 63
Стоимость за результат 0.131 2.494
Общая стоимость $0.003 $0.104
Цена входа $0.050 / 1M $0.250 / 1M
Цена выхода $0.100 / 1M $1.000 / 1M
Общее число входных токенов 46,285 34,371
Выходные токены 2,911 8,981
Токены рассуждений 0 89,812
Время ответа (среднее) 728ms 38.18s
Время ответа (макс.) 2.17s 196.21s
Время ответа (суммарно) 15.29s 763.60s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
Cost
$0.001
Time
3.2s
Tokens
491 tok

#134 MiniMax M2.7

medium
Cost
$0.022
Time
22.8s
Tokens
9,250 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
MiniMax M2.7 5.7 9.1 33.3% 0 101.89s 2,961 1,231 38,841
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452

Быстрое сравнение

Сменить пару сравнения