AI BENCHY Compare

Laguna M.1 vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	Laguna M.1 Laguna M.1 none Релиз: 2026-04-28 Бесплатно доступно	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02

Метрика	Laguna M.1 Laguna M.1 none Релиз: 2026-04-28 Бесплатно доступно	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02
Оценка	5.1	4.4
Ранг	#117	#130
Надежность	9.9	Н/Д
Стабильность	8.7	7.2
Тестов верно
Доля успешных попыток	33.3%	33.3%
Нестабильные тесты	3	6
Всего запусков	54	54
Стоимость за результат	0.000	0.976
Общая стоимость	$0.000	$0.030
???? ?????	$0.000 / 1M	$0.100 / 1M
???? ??????	$0.000 / 1M	$0.150 / 1M
Выходные токены	2,870	24,291
Токены рассуждений	0	172,597
Время ответа (среднее)	2.79s	73.64s
Время ответа (макс.)	15.42s	226.38s
Время ответа (суммарно)	50.24s	1104.60s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	3.4	7.9	16.7%	1		1.23s	485	0
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	2,621	12,411

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	7.5	3.8	66.7%	1		2.93s	543	0
Qwen3.5-9B	2.6	10.0	0.0%	0		135.61s	6,150	31,393

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	3.0	10.0	0.0%	0		4.32s	622	0
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	10.0	10.0	100.0%	0		3.37s	246	0
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	1,383	32,113

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	3.6	7.2	22.2%	1		5.50s	33	0
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	11,549	48,475

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	4.0	10.0	0.0%	0		3.08s	212	0
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	0	30,695

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	6.3	10.0	50.0%	0		683ms	80	0
Qwen3.5-9B	6.4	5.8	66.7%	1		17.15s	599	4,517

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	3.2	10.0	0.0%	0		951ms	340	0
Qwen3.5-9B	3.1	10.0	0.0%	0		33.38s	1,545	11,844

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna M.1	10.0	10.0	100.0%	0		7.54s	309	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	444	1,149

Быстрое сравнение

Сменить пару сравнения

Nemotron 3 Nano Omni 30b A3b ReasoningnoneБесплатно доступноvsQwen3.5-9Bmedium GPT-5.4 NanononevsQwen3.5-9Bmedium Ling 2.6 1tnoneБесплатно доступноvsQwen3.5-9Bmedium Qwen3.5-9BmediumvsGrok 4.1 Fastnone Qwen3.5-9BmediumvsMiMo-V2-Flashnone Nemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступноvsLaguna M.1noneБесплатно доступно Elephant AlphamediumvsLaguna M.1noneБесплатно доступно MiniMax M2.7mediumvsLaguna M.1noneБесплатно доступно Qwen3.5-9BmediumvsHY3 PreviewnoneБесплатно доступно Laguna M.1noneБесплатно доступноvsQwen3 Coder Nextmedium Mercury 2nonevsQwen3.5-9Bmedium Laguna M.1noneБесплатно доступноvsGLM 4.7 Flashmedium