Рейтинг Предметно-ориентированное x Тайм-аут

Посмотрите, какие AI-модели чаще всего сталкиваются с Тайм-аут в Предметно-ориентированное, чтобы быстрее находить слабые места. Сортировать по: Тестов верно ↓.

Показано моделей

Всего сбоев

Наиболее затронутая модель

Claude Opus 4.7 1

Причины сбоев

Неверный ответ412 Тайм-аут43 Лишнее форматирование17 Нет ответа8 Ошибка API7 Не соблюдены инструкции1

Категории

Предметно-ориентированное43 Программирование26 Комбинированный5 Решение головоломок5 Анти-ИИ уловки4 Общий интеллект4 Парсинг и извлечение данных1 Следование инструкциям1

32/32

Ранг	Модель	Компания	Количество Тайм-аут	Оценка категории	Общая стоимость	Тестов верно	Время ответа (среднее)
#15	Claude Opus 4.7 medium	Anthropic	1	7.7	$1.477	2/3	1.17s
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $1.477 Время ответа (среднее) 1.17s
#21	GPT-5.2 medium	OpenAI	1	5.9	$0.951	1/3	77.8s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.951 Время ответа (среднее) 77.8s
#33	Kimi K3 max	Moonshot AI	2	5.9	$3.112	1/3	490.1s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $3.112 Время ответа (среднее) 490.1s
#47	MiniMax M3 medium	Minimax	2	5.5	$0.286	1/3	233.1s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.286 Время ответа (среднее) 233.1s
#52	Kimi K2.7 Code medium	Moonshot AI	2	5.5	$0.751	1/3	213.3s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.751 Время ответа (среднее) 213.3s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	5.3	$0.437	1/3	17.5s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.437 Время ответа (среднее) 17.5s
#58	Qwen3.5-27B medium	Qwen	1	5.3	$1.627	1/3	79.5s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.627 Время ответа (среднее) 79.5s
#68	Kimi K2.6 medium	Moonshot AI	2	5.3	$1.036	1/3	202.4s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.036 Время ответа (среднее) 202.4s
#74	GLM 5.1 medium	Z.ai	1	5.3	$0.535	1/3	29.8s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.535 Время ответа (среднее) 29.8s
#109	Mimo V2 PRO medium	Xiaomi	1	5.3	$0.333	1/3	8.82s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.333 Время ответа (среднее) 8.82s
#114	Qwen3.5-Flash medium	Qwen	1	5.3	$0.139	1/3	146.5s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.139 Время ответа (среднее) 146.5s
#128	GPT-5 Nano medium	OpenAI	1	5.2	$0.114	1/3	204.0s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.114 Время ответа (среднее) 204.0s
#185	Grok 4.1 Fast medium	X AI	1	5.8	$0.069	1/3	121.8s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.069 Время ответа (среднее) 121.8s
#26	GPT-5 Mini medium	OpenAI	1	3.6	$0.237	0/3	44.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.237 Время ответа (среднее) 44.6s
#31	GLM 5.2 high	Z.ai	1	3.7	$0.970	0/3	74.0s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.970 Время ответа (среднее) 74.0s

Фильтровать модели

Лучшие модели по Количество Тайм-аут

Количество Тайм-аут против Оценка

Лучшие модели по Время ответа (среднее)

Лучшие модели по Оценочная стоимость потерь

Предметно-ориентированное: Тайм-аут

Фильтровать модели

Лучшие модели по Количество Тайм-аут

Количество Тайм-аут против Оценка

Лучшие модели по Время ответа (среднее)

Лучшие модели по Оценочная стоимость потерь