AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Сбои по категориям AI BENCHY

Эрудиция: Ошибка API

Эрудиция
Ошибка API

Посмотрите, какие AI-модели чаще всего сталкиваются с Ошибка API в Эрудиция, чтобы быстрее находить слабые места. Сортировать по: Тестов верно ↑.

Показано моделей

12

Всего сбоев

12

Наиболее затронутая модель

Gemini 3 PRO Preview 1
Ранг Модель Компания Количество Ошибка API Оценка категории Тестов верно Время ответа (среднее)
#35 Gemini 3 PRO Preview medium Google 1 3.0 0/1 0ms
#92 Laguna M.1 medium Poolside 1 3.0 0/1 0ms
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/1 0ms
#107 Laguna Xs.2 medium Poolside 1 3.0 0/1 0ms
#136 Elephant Alpha medium Openrouter 1 3.0 0/1 0ms
#137 Elephant Alpha none Openrouter 1 3.0 0/1 0ms
#145 Laguna M.1 none Poolside 1 3.0 0/1 0ms
#146 Laguna Xs.2 none Poolside 1 3.0 0/1 0ms
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 3.0 0/1 0ms
#159 Ling-2.6-1T none Inclusionai 1 3.0 0/1 0ms
#161 Qwen3.5-9B medium Qwen 1 3.0 0/1 177.0s
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 1 3.0 0/1 0ms

Лучшие модели по Количество Ошибка API

Количество Ошибка API против Оценка

Лучшие модели по Время ответа (среднее)

Лучшие модели по Оценочная стоимость потерь