AI BENCHY Compare

Laguna Xs.2 vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	Laguna Xs.2 Laguna Xs.2 none Релиз: 2026-04-28 Бесплатно доступно	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02

Метрика	Laguna Xs.2 Laguna Xs.2 none Релиз: 2026-04-28 Бесплатно доступно	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02
Оценка	5.0	4.4
Ранг	#118	#130
Надежность	9.9	Н/Д
Стабильность	10.0	7.2
Тестов верно
Доля успешных попыток	27.8%	33.3%
Нестабильные тесты	0	6
Всего запусков	54	54
Стоимость за результат	0.000	0.976
Общая стоимость	$0.000	$0.030
???? ?????	$0.000 / 1M	$0.100 / 1M
???? ??????	$0.000 / 1M	$0.150 / 1M
Выходные токены	3,824	24,291
Токены рассуждений	0	172,597
Время ответа (среднее)	1.68s	73.64s
Время ответа (макс.)	16.04s	226.38s
Время ответа (суммарно)	30.26s	1104.60s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	3.2	10.0	0.0%	0		743ms	933	0
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	2,621	12,411

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	2.5	10.0	0.0%	0		1.96s	866	0
Qwen3.5-9B	2.6	10.0	0.0%	0		135.61s	6,150	31,393

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	3.0	10.0	0.0%	0		2.01s	521	0
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	10.0	10.0	100.0%	0		646ms	246	0
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	1,383	32,113

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	5.3	10.0	33.3%	0		371ms	33	0
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	11,549	48,475

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	5.0	10.0	0.0%	0		16.04s	200	0
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	0	30,695

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	6.5	10.0	50.0%	0		439ms	81	0
Qwen3.5-9B	6.4	5.8	66.7%	1		17.15s	599	4,517

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	5.4	10.0	33.3%	0		688ms	552	0
Qwen3.5-9B	3.1	10.0	0.0%	0		33.38s	1,545	11,844

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Laguna Xs.2	3.0	10.0	0.0%	0		1.93s	392	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	444	1,149

Быстрое сравнение

Сменить пару сравнения

Nemotron 3 Nano Omni 30b A3b ReasoningnoneБесплатно доступноvsQwen3.5-9Bmedium GPT-5.4 NanononevsQwen3.5-9Bmedium Ling 2.6 1tnoneБесплатно доступноvsQwen3.5-9Bmedium Qwen3.5-9BmediumvsGrok 4.1 Fastnone Qwen3.5-9BmediumvsMiMo-V2-Flashnone Nemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступноvsLaguna Xs.2noneБесплатно доступно Elephant AlphamediumvsLaguna Xs.2noneБесплатно доступно MiniMax M2.7mediumvsLaguna Xs.2noneБесплатно доступно Qwen3.5-9BmediumvsHY3 PreviewnoneБесплатно доступно Laguna Xs.2noneБесплатно доступноvsQwen3 Coder Nextmedium Mercury 2nonevsQwen3.5-9Bmedium Laguna Xs.2noneБесплатно доступноvsGLM 4.7 Flashmedium