Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Poolside: Laguna XS 2.1 vs Qwen: Qwen3.6 Flash

Сводка

Сравнение benchmark Laguna XS 2.1 vs Qwen3.6 Flash: Qwen3.6 Flash лидирует по среднему баллу: 6.0 vs 5.3. Laguna XS 2.1 имеет более низкую стоимость benchmark: $0.003 vs $0.015. Laguna XS 2.1 быстрее: 722ms vs 1.60s, с долей успешных попыток 31.8% vs 33.3%.

Рекомендуемая модель: Qwen3.6 Flash - У него самый высокий балл в этом сравнении (6.0) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика Laguna XS 2.1 Laguna XS 2.1 none Релиз: 2026-07-02 Бесплатно доступно Qwen3.6 Flash Qwen3.6 Flash none Релиз: 2026-04-20
Оценка 5.3 6.0
Ранг #128 #105
Надежность 10.0 10.0
Стабильность 9.0 10.0
Тестов верно
Доля успешных попыток 31.8% 33.3%
Нестабильные тесты 3 0
Всего запусков 63 63
Стоимость за результат 0.058 0.266
Общая стоимость $0.003 $0.015
Цена входа $0.060 / 1M $0.188 / 1M
Цена выхода $0.120 / 1M $1.125 / 1M
Общее число входных токенов 41,148 50,810
Выходные токены 3,451 4,164
Токены рассуждений 0 0
Время ответа (среднее) 722ms 1.60s
Время ответа (макс.) 2.30s 4.60s
Время ответа (суммарно) 15.17s 33.59s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#128 Laguna XS 2.1

none
Стоимость
$0.001
Время
27.6s
Токены
4,344 tok

#105 Qwen3.6 Flash

none
Стоимость
$0.005
Время
20.1s
Токены
4,211 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 5.3 8.3 33.3% 1 755ms 774 1,015 0
Qwen3.6 Flash 3.1 10.0 0.0% 0 1.63s 696 1,554 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 4.3 7.8 22.2% 1 623ms 7,995 562 0
Qwen3.6 Flash 5.4 10.0 33.3% 0 1.79s 6,488 889 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 3.0 10.0 0.0% 0 1.76s 14,197 402 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 4.22s 24,675 315 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 10.0 10.0 100.0% 0 768ms 7,734 240 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.13s 7,794 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 5.3 10.0 33.3% 0 364ms 834 14 0
Qwen3.6 Flash 5.3 10.0 33.3% 0 1.11s 789 15 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 5.0 10.0 0.0% 0 529ms 537 128 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 947ms 522 132 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 3.8 5.8 33.3% 1 364ms 638 50 0
Qwen3.6 Flash 6.3 10.0 50.0% 0 1.10s 711 66 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 3.0 10.0 0.0% 0 1.01s 771 730 0
Qwen3.6 Flash 3.5 10.0 0.0% 0 1.21s 714 669 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 10.0 10.0 100.0% 0 1.36s 7,413 300 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.49s 8,211 272 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Laguna XS 2.1 3.0 10.0 0.0% 0 254ms 255 10 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 649ms 210 9 0

Быстрое сравнение

Сменить пару сравнения