Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Laguna Xs.2 vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика Laguna Xs.2 Laguna Xs.2 none Релиз: 2026-04-28 Бесплатно доступно Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02
Оценка 5.0 4.4
Ранг #118 #130
Надежность 9.9 Н/Д
Стабильность 10.0 7.2
Тестов верно
Доля успешных попыток 27.8% 33.3%
Нестабильные тесты 0 6
Всего запусков 54 54
Стоимость за результат 0.000 0.976
Общая стоимость $0.000 $0.030
???? ????? $0.000 / 1M $0.100 / 1M
???? ?????? $0.000 / 1M $0.150 / 1M
Выходные токены 3,824 24,291
Токены рассуждений 0 172,597
Время ответа (среднее) 1.68s 73.64s
Время ответа (макс.) 16.04s 226.38s
Время ответа (суммарно) 30.26s 1104.60s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 3.2 10.0 0.0% 0 743ms 933 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 2.5 10.0 0.0% 0 1.96s 866 0
Qwen3.5-9B 2.6 10.0 0.0% 0 135.61s 6,150 31,393
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 3.0 10.0 0.0% 0 2.01s 521 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 10.0 10.0 100.0% 0 646ms 246 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 5.3 10.0 33.3% 0 371ms 33 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 5.0 10.0 0.0% 0 16.04s 200 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 6.5 10.0 50.0% 0 439ms 81 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 5.4 10.0 33.3% 0 688ms 552 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Laguna Xs.2 3.0 10.0 0.0% 0 1.93s 392 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

Быстрое сравнение

Сменить пару сравнения