Granite 4.1 8B vs Qwen3.5-9B (medium)

Рекомендуемая модель Granite 4.1 8B

Здесь у него лучший балл (4.0), при этом он примерно в 5.7 раза дешевле, чем Qwen3.5-9B (medium).

Подробное сравнение

Метрика	Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02

Метрика	Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02
Оценка	4.0	3.8
Ранг	#224	#227
Надежность	10.0	5.0
Стабильность	10.0	8.1
Тестов верно
Доля успешных попыток	9.1%	25.8%
Нестабильные тесты	0	5
Всего запусков	66	66
Стоимость за результат	0.315	1.187
Общая стоимость	$0.007	$0.036
Цена входа	$0.050 / 1M	$0.100 / 1M
Цена выхода	$0.100 / 1M	$0.150 / 1M
Общее число входных токенов	113,827	17,070
Выходные токены	5,996	29,045
Токены рассуждений	0	209,516
Время ответа (среднее)	1.45s	82.24s
Время ответа (макс.)	16.67s	226.38s
Время ответа (суммарно)	31.96s	1315.88s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	645	903	0
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	369	2,621	12,411

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	4.5	10.0	0.0%	0		775ms	8,344	525	0
Qwen3.5-9B	2.9	10.0	0.0%	0		100.88s	2,396	7,890	41,129

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	3.0	10.0	0.0%	0		9.28s	86,631	3,481	0
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	7,617	195	0
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	4,722	1,383	32,113

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	768	24	0
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	295	11,549	48,475

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	528	115	0
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	180	0	30,695

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	687	66	0
Qwen3.5-9B	6.5	10.0	50.0%	0		5.75s	381	491	1,824

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	672	432	0
Qwen3.5-9B	3.0	10.0	0.0%	0		32.27s	376	1,593	12,026

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	7,719	243	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	8,283	444	1,149

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	216	12	0
Qwen3.5-9B	3.0	10.0	0.0%	0		177.02s	68	3,074	29,694

Сменить пару сравнения