Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs Qwen: Qwen3 Coder Next

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-04

Метрика Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16 Qwen3 Coder Next Qwen3 Coder Next none Релиз: 2026-02-03
Оценка 5.3 5.0
Ранг #75 #79
Стабильность 9.5 10.0
Тестов верно
Доля успешных попыток 33.3% 23.5%
Нестабильные тесты 1 0
Всего запусков 51 51
Стоимость за результат 0.108 0.175
Общая стоимость $0.006 $0.007
???? ????? $0.150 / 1M $0.120 / 1M
???? ?????? $0.600 / 1M $0.750 / 1M
Выходные токены 1,624 3,032
Токены рассуждений 0 0
Время ответа (среднее) 629ms 10.82s
Время ответа (макс.) 1.72s 45.14s
Время ответа (суммарно) 10.70s 118.99s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
Qwen3 Coder Next 3.6 10.0 0.0% 0 3.31s 1,321 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 45.14s 317 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
Qwen3 Coder Next 6.5 10.0 50.0% 0 1.32s 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
Qwen3 Coder Next 5.3 10.0 33.3% 0 962ms 26 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 1.34s 152 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
Qwen3 Coder Next 4.8 10.0 0.0% 0 7.71s 63 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
Qwen3 Coder Next 3.2 10.0 0.0% 0 22.86s 652 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 2.47s 255 0

Быстрое сравнение

Сменить пару сравнения