Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

IBM: Granite 4.1 8B vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01 Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02
Оценка 4.3 4.4
Ранг #135 #132
Надежность 10.0 Н/Д
Стабильность 10.0 7.2
Тестов верно
Доля успешных попыток 11.1% 33.3%
Нестабильные тесты 0 6
Всего запусков 54 54
Стоимость за результат 0.110 0.976
Общая стоимость $0.003 $0.030
???? ????? $0.050 / 1M $0.100 / 1M
???? ?????? $0.100 / 1M $0.150 / 1M
Выходные токены 2,712 24,291
Токены рассуждений 0 172,597
Время ответа (среднее) 767ms 73.64s
Время ответа (макс.) 2.17s 226.38s
Время ответа (суммарно) 13.81s 1104.60s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 6.9 10.0 0.0% 0 1.07s 339 0
Qwen3.5-9B 2.6 10.0 0.0% 0 135.61s 6,150 31,393
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.7 10.0 0.0% 0 635ms 431 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

Быстрое сравнение

Сменить пару сравнения