Рейтинг моделей по Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Метрика ↑.

Показано моделей

Среднее значение Оценка Предметно-ориентированное

4.7

Лучшая модель

GLM 5 Turbo 2.9

Причины сбоев

С причиной сбоя Неверный ответ421 С причиной сбоя Тайм-аут43 С причиной сбоя Лишнее форматирование17 С причиной сбоя Нет ответа8 С причиной сбоя Ошибка API7 С причиной сбоя Не соблюдены инструкции1

216/216

Ранг	Модель	Компания	Оценка Предметно-ориентированное	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#215	Step 3.5 Flash none	Stepfun	3.3	2.3	$0.020	1/1	34.5s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.020 Время ответа (среднее) 34.5s
#19	Muse Spark 1.1 medium	Meta	3.5	8.6	$1.357	0/3	71.4s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.357 Время ответа (среднее) 71.4s
#30	Muse Spark 1.1 high	Meta	3.5	8.1	$1.694	0/3	67.4s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.694 Время ответа (среднее) 67.4s
#46	GLM 5 medium	Z.ai	3.5	7.7	$0.307	0/3	0ms
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.307 Время ответа (среднее) 0ms
#55	Nemotron 3 Ultra medium	NVIDIA	3.5	7.5	$0.774	0/3	24.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.774 Время ответа (среднее) 24.9s
#58	GPT-5.3 Chat none	OpenAI	3.5	7.5	$0.571	0/3	13.0s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.571 Время ответа (среднее) 13.0s
#81	Kimi K2.5 medium	Moonshot AI	3.5	7.0	$0.600	0/3	137.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.600 Время ответа (среднее) 137.3s
#89	Qwen3.6 Flash medium	Qwen	3.5	6.9	$0.738	0/3	14.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.738 Время ответа (среднее) 14.6s
#114	Ring-2.6-1T medium	Inclusionai	3.5	6.3	$0.103	0/3	64.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.103 Время ответа (среднее) 64.9s
#142	GPT-5.4 Mini none	OpenAI	3.5	5.9	$0.095	0/3	937ms
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.095 Время ответа (среднее) 937ms
#167	Qwen3.6 35B A3B none	Qwen	3.5	5.3	$0.061	0/3	7.45s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.061 Время ответа (среднее) 7.45s
#200	GLM 4.7 Flash medium	Z.ai	3.5	4.3	$0.166	0/3	174.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.166 Время ответа (среднее) 174.6s
#15	Grok 4.5 high	X AI	3.6	8.9	$1.707	0/3	332.1s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.707 Время ответа (среднее) 332.1s
#29	GPT-5 Mini medium	OpenAI	3.6	8.1	$0.237	0/3	44.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.237 Время ответа (среднее) 44.6s
#40	Qwen3.7 Plus medium	Qwen	3.6	7.9	$0.267	0/3	45.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.267 Время ответа (среднее) 45.3s

Рейтинг Предметно-ориентированное

Фильтровать модели

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)