Рейтинг моделей по Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Время ответа (среднее) ↓.

Показано моделей

Среднее значение Оценка Предметно-ориентированное

4.7

Лучшая модель

Kimi K3 5.9

Причины сбоев

С причиной сбоя Неверный ответ421 С причиной сбоя Тайм-аут43 С причиной сбоя Лишнее форматирование17 С причиной сбоя Нет ответа8 С причиной сбоя Ошибка API7 С причиной сбоя Не соблюдены инструкции1

216/216

Ранг	Модель	Компания	Оценка Предметно-ориентированное	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#30	Muse Spark 1.1 high	Meta	3.5	8.1	$1.694	0/3	67.4s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.694 Время ответа (среднее) 67.4s
#108	Laguna XS 2.1 medium	Poolside	2.9	6.5	$0.068	0/3	65.7s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.068 Время ответа (среднее) 65.7s
#60	GPT-5.4 Mini medium	OpenAI	4.1	7.5	$0.756	0/3	65.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.756 Время ответа (среднее) 65.3s
#114	Ring-2.6-1T medium	Inclusionai	3.5	6.3	$0.103	0/3	64.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.103 Время ответа (среднее) 64.9s
#16	GPT-5.3-Codex medium	OpenAI	5.9	8.9	$0.920	1/3	64.3s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.920 Время ответа (среднее) 64.3s
#76	Qwen3.5-122B-A10B medium	Qwen	2.9	7.1	$1.046	0/3	63.4s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.046 Время ответа (среднее) 63.4s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	2.9	3.4	$0.000	0/3	56.7s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.000 Время ответа (среднее) 56.7s
#20	Claude Fable 5 medium	Anthropic	5.3	8.6	$3.478	1/3	53.4s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $3.478 Время ответа (среднее) 53.4s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	2.9	7.2	$0.317	0/3	53.1s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.317 Время ответа (среднее) 53.1s
#127	gpt-oss-120b medium	OpenAI	2.9	6.1	$0.019	0/3	50.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.019 Время ответа (среднее) 50.9s
#33	Step 3.7 Flash medium	Stepfun	7.7	8.0	$0.515	2/3	48.3s
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $0.515 Время ответа (среднее) 48.3s
#140	Mimo V2 Omni medium	Xiaomi	3.0	5.9	$0.683	0/3	47.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.683 Время ответа (среднее) 47.9s
#7	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.316 Время ответа (среднее) 47.9s
#45	Claude Opus 4.8 low	Anthropic	5.3	7.8	$2.077	1/3	45.5s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $2.077 Время ответа (среднее) 45.5s
#42	GLM 5.2 medium	Z.ai	4.1	7.8	$0.187	0/3	45.5s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.187 Время ответа (среднее) 45.5s

Рейтинг Предметно-ориентированное

Фильтровать модели

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)