AI BENCHY
Сравнить Графики Методология
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Сбои AI BENCHY

Сбои: Нет ответа

Посмотрите, какие AI-модели чаще всего сталкиваются с Нет ответа, чтобы заранее заметить риски надежности. Сортировать по: Тестов верно ↑.

Показано моделей

6

Всего сбоев

7

Наиболее затронутая модель

GLM 4.7 Flash 2
Ранг Модель Компания Количество Нет ответа Средний балл Тестов верно Время ответа (среднее)
#52 GLM 4.7 Flash medium Z.ai 2 3.1 4/16 36.8s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#28 Kimi K2.5 medium Moonshot AI 1 6.4 9/16 69.8s
#30 Grok 4.1 Fast medium X AI 1 6.2 9/16 26.3s
#27 GPT-5.2 medium OpenAI 1 6.5 10/16 15.3s
#14 GLM 5 medium Z.ai 1 7.4 11/16 16.2s

Лучшие модели по Количество Нет ответа

Количество Нет ответа vs средний балл

Лучшие модели по Время ответа (среднее)